サーチ…


前書き

分析を行うには、Rでのデータのクリーニングが最も重要です。あなたが持っているデータは、現場での測定やウェブから削られたものであろうと、それを再構成したり、変換したり、フィルタリングして分析に適したものにする必要があります。このドキュメントでは、次のトピックについて説明します。 - 欠落したデータによる観測の削除 - データの因数分解 - 不完全な行の削除

ベクターから欠けているデータを取り除く

まず、Vector1というベクトルを作成します。

set.seed(123)
Vector1 <- rnorm(20)

不足しているデータを追加する:

set.seed(123)
Vector1[sample(1:length(Vector1), 5)] <- NA

次に、is.na関数を使用してVectorのサブセットを作成します

Vector1 <- Vector1[!is.na(Vector1)]

結果のベクトルは元のVector1のNAsを削除します

不完全な行の削除

データフレームがあり、NA値を含む可能性があるすべての行を削除したい場合があります。これは、 complete.cases関数が最適なオプションであるためです。

我々は、既にNAsを有しているので、一例として空気質データセットの最初の6行を使用する

x <- head(airquality)

これには、Solar.R列にNAsを含む2行があります。これらの行を削除するには、次の操作を行います

x_no_NA <- x[complete.cases(x),]

結果のデータフレームx_no_NAは、NAsのない完全な行しか持たない



Modified text is an extract of the original Stack Overflow Documentation
ライセンスを受けた CC BY-SA 3.0
所属していない Stack Overflow