수색…


통사론

  • strsplit (
  • 엑스
  • 스플릿
  • 고정 = 거짓
  • perl = FALSE
  • useBytes = FALSE)

소개

strsplit 은 벡터를 일부 문자 패턴의 목록으로 분리하는 데 유용한 함수입니다. 일반적인 R 도구를 사용하면 전체 목록을 data.frame에 다시 통합하거나 목록의 일부를 그래프 작업에 사용할 수 있습니다.

다음은 strsplit 의 일반적인 사용법입니다 : 쉼표로 분리 문자 벡터 분리 :

temp <- c("this,that,other", "hat,scarf,food", "woman,man,child")
# get a list split by commas
myList <- strsplit(temp, split=",")
# print myList
myList
[[1]]
[1] "this"  "that"  "other"

[[2]]
[1] "hat"   "scarf" "food" 

[[3]]
[1] "woman" "man"   "child"

위에서 암시했듯이 split 인수는 문자에만 국한되지 않고 정규 표현식에 의해 지정된 패턴을 따를 수 있습니다. 예를 들어, temp2는 분리 기호가 각 항목에 대해 변경된 것을 제외하고는 위의 temp와 동일합니다. 분할 인수가 정규 표현식을 받아 벡터의 불규칙성을 완화한다는 사실을 활용할 수 있습니다.

temp2 <- c("this, that, other", "hat,scarf ,food", "woman; man ; child")
myList2 <- strsplit(temp2, split=" ?[,;] ?")
myList2
[[1]]
[1] "this"  "that"  "other"

[[2]]
[1] "hat"   "scarf" "food" 

[[3]]
[1] "woman" "man"   "child"

참고 사항 :

  1. 정규식 구문을 분해하는 것은이 예제의 범위를 벗어납니다.
  2. 때로는 일치하는 정규식은 프로세스 속도를 늦출 수 있습니다. 정규 표현식을 사용할 수있는 많은 R 함수와 마찬가지로, 고정 인수는 R에 분할 문자를 문자 그대로 매치 시키도록 지시하는 데 사용할 수 있습니다.


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow