R Language
Dane do czyszczenia
Szukaj…
Wprowadzenie
Czyszczenie danych w R ma kluczowe znaczenie dla każdej analizy. bez względu na to, jakie masz dane, czy to z pomiarów wykonanych w terenie, czy zeskrobanych z sieci, najprawdopodobniej będziesz musiał je przekształcić, przekształcić lub przefiltrować, aby było odpowiednie do analizy. W tej dokumentacji zajmiemy się następującymi tematami: - Usuwanie obserwacji z brakującymi danymi - Faktoryzowanie danych - Usuwanie niekompletnych wierszy
Usuwanie brakujących danych z wektora
Najpierw stwórzmy wektor o nazwie Vector1:
set.seed(123)
Vector1 <- rnorm(20)
I dodaj do niego brakujące dane:
set.seed(123)
Vector1[sample(1:length(Vector1), 5)] <- NA
Teraz możemy użyć funkcji is.na do podzestawu Vector
Vector1 <- Vector1[!is.na(Vector1)]
Teraz powstały wektor usunie NA z oryginalnego Vector1
Usuwanie niekompletnych wierszy
Może się zdarzyć, że masz ramkę danych i chcesz usunąć wszystkie wiersze, które mogą zawierać wartość NA, w tym celu funkcja complete. Przypadki jest najlepszą opcją.
Będziemy używać pierwszych 6 rzędów po zbiorze czystości powietrza dać przykład, ponieważ ma już NAS
x <- head(airquality)
Ma dwa wiersze z NA w kolumnie Solar.R, aby je usunąć, wykonaj następujące czynności
x_no_NA <- x[complete.cases(x),]
Wynikowa ramka danych x_no_NA będzie miała tylko pełne wiersze bez NA
Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow