data.table => 데이터 정리

중복 처리

# example data
DT = data.table(id = c(1,2,2,3,3,3))[, v := LETTERS[.I]][]

일명 "drop duplicates"일명 "deduplicate"일명 "uniquify".

unique(DT, by="id")
# or
DT[, .SD[1L], by=id]
#    id v
# 1:  1 A
# 2:  2 B
# 3:  3 D

이것은 첫 번째 행을 유지합니다. 다른 행을 선택하려면, 1L 부품을 사용하거나 i 에서 order 을 사용할 수 있습니다.

DT[, if (.N == 1L) .SD, by=id]
#    id v
# 1:  1 A

DT[, if (.N > 1L) .SD, by=id]
#    id v
# 1:  2 B
# 2:  2 C
# 3:  3 D
# 4:  3 E
# 5:  3 F

Modified text is an extract of the original Stack Overflow Documentation

아래 라이선스 CC BY-SA 3.0

와 제휴하지 않음 Stack Overflow