Buscar..


Sintaxis

  • strsplit
  • X
  • división
  • fijo = FALSO
  • perl = FALSO
  • useBytes = FALSO

Introducción

strsplit es una función útil para dividir un vector en una lista en algún patrón de caracteres. Con las herramientas de R típicas, la lista completa se puede reincorporar a un data.frame o parte de la lista podría usarse en un ejercicio de representación gráfica.

Este es un uso común de strsplit : dividir un vector de caracteres a lo largo de un separador de coma:

temp <- c("this,that,other", "hat,scarf,food", "woman,man,child")
# get a list split by commas
myList <- strsplit(temp, split=",")
# print myList
myList
[[1]]
[1] "this"  "that"  "other"

[[2]]
[1] "hat"   "scarf" "food" 

[[3]]
[1] "woman" "man"   "child"

Como se indicó anteriormente, el argumento de división no se limita a los caracteres, sino que puede seguir un patrón dictado por una expresión regular. Por ejemplo, temp2 es idéntico a la temperatura anterior, excepto que los separadores se han modificado para cada elemento. Podemos aprovechar el hecho de que el argumento de división acepta expresiones regulares para aliviar la irregularidad en el vector.

temp2 <- c("this, that, other", "hat,scarf ,food", "woman; man ; child")
myList2 <- strsplit(temp2, split=" ?[,;] ?")
myList2
[[1]]
[1] "this"  "that"  "other"

[[2]]
[1] "hat"   "scarf" "food" 

[[3]]
[1] "woman" "man"   "child"

Notas :

  1. Desglosar la sintaxis de expresiones regulares está fuera del alcance de este ejemplo.
  2. A veces, hacer coincidir expresiones regulares puede ralentizar un proceso. Al igual que con muchas funciones R que permiten el uso de expresiones regulares, el argumento fijo está disponible para indicar a R que coincida literalmente con los caracteres divididos.


Modified text is an extract of the original Stack Overflow Documentation
Licenciado bajo CC BY-SA 3.0
No afiliado a Stack Overflow