R Language
データのクリーニング
サーチ…
前書き
分析を行うには、Rでのデータのクリーニングが最も重要です。あなたが持っているデータは、現場での測定やウェブから削られたものであろうと、それを再構成したり、変換したり、フィルタリングして分析に適したものにする必要があります。このドキュメントでは、次のトピックについて説明します。 - 欠落したデータによる観測の削除 - データの因数分解 - 不完全な行の削除
ベクターから欠けているデータを取り除く
まず、Vector1というベクトルを作成します。
set.seed(123)
Vector1 <- rnorm(20)
不足しているデータを追加する:
set.seed(123)
Vector1[sample(1:length(Vector1), 5)] <- NA
次に、is.na関数を使用してVectorのサブセットを作成します
Vector1 <- Vector1[!is.na(Vector1)]
結果のベクトルは元のVector1のNAsを削除します
不完全な行の削除
データフレームがあり、NA値を含む可能性があるすべての行を削除したい場合があります。これは、 complete.cases関数が最適なオプションであるためです。
我々は、既にNAsを有しているので、一例として空気質データセットの最初の6行を使用する
x <- head(airquality)
これには、Solar.R列にNAsを含む2行があります。これらの行を削除するには、次の操作を行います
x_no_NA <- x[complete.cases(x),]
結果のデータフレームx_no_NAは、NAsのない完全な行しか持たない
Modified text is an extract of the original Stack Overflow Documentation
ライセンスを受けた CC BY-SA 3.0
所属していない Stack Overflow