Szukaj…


Wprowadzenie

Czyszczenie danych w R ma kluczowe znaczenie dla każdej analizy. bez względu na to, jakie masz dane, czy to z pomiarów wykonanych w terenie, czy zeskrobanych z sieci, najprawdopodobniej będziesz musiał je przekształcić, przekształcić lub przefiltrować, aby było odpowiednie do analizy. W tej dokumentacji zajmiemy się następującymi tematami: - Usuwanie obserwacji z brakującymi danymi - Faktoryzowanie danych - Usuwanie niekompletnych wierszy

Usuwanie brakujących danych z wektora

Najpierw stwórzmy wektor o nazwie Vector1:

set.seed(123)
Vector1 <- rnorm(20)

I dodaj do niego brakujące dane:

set.seed(123)
Vector1[sample(1:length(Vector1), 5)] <- NA

Teraz możemy użyć funkcji is.na do podzestawu Vector

Vector1 <- Vector1[!is.na(Vector1)]

Teraz powstały wektor usunie NA z oryginalnego Vector1

Usuwanie niekompletnych wierszy

Może się zdarzyć, że masz ramkę danych i chcesz usunąć wszystkie wiersze, które mogą zawierać wartość NA, w tym celu funkcja complete. Przypadki jest najlepszą opcją.

Będziemy używać pierwszych 6 rzędów po zbiorze czystości powietrza dać przykład, ponieważ ma już NAS

x <- head(airquality)

Ma dwa wiersze z NA w kolumnie Solar.R, aby je usunąć, wykonaj następujące czynności

x_no_NA <- x[complete.cases(x),]

Wynikowa ramka danych x_no_NA będzie miała tylko pełne wiersze bez NA



Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow