खोज…


परिचय

किसी भी विश्लेषण करने के लिए R में डेटा की सफाई सर्वोपरि है। आपके पास जो भी डेटा है, वह फ़ील्ड में लिए गए मापों से हो या वेब से स्क्रैप किया गया हो, यह सबसे अधिक संभावना है कि आपको इसे फिर से खोलना होगा, इसे बदलना होगा या इसे अपने विश्लेषण के लिए उपयुक्त बनाने के लिए फ़िल्टर करना होगा। इस दस्तावेज़ में, हम निम्नलिखित विषयों को शामिल करेंगे: - लापता डेटा के साथ टिप्पणियों को हटाना - डेटा को फैक्टर करना - अपूर्ण पंक्तियों को हटाना

एक वेक्टर से लापता डेटा को हटाना

पहले वेक्टर 1 नामक एक वेक्टर बनाने देता है:

set.seed(123)
Vector1 <- rnorm(20)

और इसमें अनुपलब्ध डेटा जोड़ें:

set.seed(123)
Vector1[sample(1:length(Vector1), 5)] <- NA

अब हम वेक्टर को कम करने के लिए is.na फ़ंक्शन का उपयोग कर सकते हैं

Vector1 <- Vector1[!is.na(Vector1)]

अब परिणामी वेक्टर ने मूल वेक्टर 1 के NA को हटा दिया होगा

अधूरी पंक्तियों को हटाना

कई बार ऐसा हो सकता है कि आपके पास एक डेटा फ़्रेम है और आप उन सभी पंक्तियों को हटाना चाहते हैं जिनमें NA मान हो सकता है, इसके लिए फ़ंक्शन पूर्ण.काम सबसे अच्छा विकल्प है।

हम पहले से ही NAs है, उदाहरण के लिए एयरक्विटी डेटासेट की पहली 6 पंक्तियों का उपयोग करेंगे

x <- head(airquality)

यह सौर पंक्ति में NAs के साथ दो पंक्तियाँ हैं, उन्हें हटाने के लिए हम निम्नलिखित करते हैं

x_no_NA <- x[complete.cases(x),]

परिणामी डेटाफ्रेम x_no_NA में केवल NA के बिना पूरी पंक्तियाँ होंगी



Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow