data.table => सफाई डेटा

डुप्लिकेट को संभालना

# example data
DT = data.table(id = c(1,2,2,3,3,3))[, v := LETTERS[.I]][]

अका "ड्रॉप डुप्लिकेट" उर्फ "डिडुप्लिकेट" उर्फ "यूनीक"।

unique(DT, by="id")
# or
DT[, .SD[1L], by=id]
#    id v
# 1:  1 A
# 2:  2 B
# 3:  3 D

यह पहली पंक्ति रखता है। एक अलग पंक्ति का चयन करने के लिए, कोई 1L भाग के साथ फील कर सकता है या i में order का उपयोग कर सकता है।

DT[, if (.N == 1L) .SD, by=id]
#    id v
# 1:  1 A

DT[, if (.N > 1L) .SD, by=id]
#    id v
# 1:  2 B
# 2:  2 C
# 3:  3 D
# 4:  3 E
# 5:  3 F

Modified text is an extract of the original Stack Overflow Documentation

के तहत लाइसेंस प्राप्त है CC BY-SA 3.0

से संबद्ध नहीं है Stack Overflow