수색…


소개

R에서 데이터를 정리하는 것이 가장 중요합니다. 어떤 데이터를 가지고 있든, 현장에서 측정 한 것이거나 웹에서 긁어 낸 것일 수도 있습니다. 재구성하거나 변형하거나 분석하여 분석에 적합하도록해야 할 가능성이 가장 큽니다. 이 문서에서는 다음 항목을 다룹니다. - 누락 된 데이터로 인한 관측 제거 - 데이터 요소 화 - 불완전한 행 제거

벡터에서 누락 된 데이터 제거

먼저 Vector1이라는 벡터를 만듭니다.

set.seed(123)
Vector1 <- rnorm(20)

누락 된 데이터를 추가하십시오.

set.seed(123)
Vector1[sample(1:length(Vector1), 5)] <- NA

이제 is.na 함수를 사용하여 Vector의 하위 집합을 만들 수 있습니다.

Vector1 <- Vector1[!is.na(Vector1)]

결과 벡터는 원래 Vector1의 NA를 제거합니다.

불완전한 행 제거하기

데이터 프레임이 있고 NA 값을 포함 할 수있는 모든 행을 제거하려는 경우가있을 수 있습니다. 이는 complete.cases 함수가 가장 좋은 옵션이기 때문입니다.

우리는 이미 공기 정화 데이터 세트의 처음 6 행을 사용하여 이미 NAs를 가지고 있으므로 예제를 만들 것입니다

x <- head(airquality)

여기에는 Solar.R 열에 NAs가있는 행이 2 개 있으며이를 제거하기 위해 다음을 수행합니다.

x_no_NA <- x[complete.cases(x),]

결과 데이터 프레임 x_no_NA 는 NAs가없는 완전한 행만 가질 것입니다



Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow