data.table
सफाई डेटा
खोज…
डुप्लिकेट को संभालना
# example data
DT = data.table(id = c(1,2,2,3,3,3))[, v := LETTERS[.I]][]
"डुप्लिकेट्स" से निपटने के लिए, एक समूह में गिनती पंक्तियों को मिलाएं और समूह द्वारा पंक्तियों को हटा दें ।
प्रति समूह एक पंक्ति रखें
अका "ड्रॉप डुप्लिकेट" उर्फ "डिडुप्लिकेट" उर्फ "यूनीक"।
unique(DT, by="id")
# or
DT[, .SD[1L], by=id]
# id v
# 1: 1 A
# 2: 2 B
# 3: 3 D
यह पहली पंक्ति रखता है। एक अलग पंक्ति का चयन करने के लिए, कोई 1L
भाग के साथ फील कर सकता है या i
में order
का उपयोग कर सकता है।
केवल अनोखी पंक्तियों को रखें
DT[, if (.N == 1L) .SD, by=id]
# id v
# 1: 1 A
केवल nonunique पंक्तियों को रखें
DT[, if (.N > 1L) .SD, by=id]
# id v
# 1: 2 B
# 2: 2 C
# 3: 3 D
# 4: 3 E
# 5: 3 F
Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow