R Language
diagrama de caja
Buscar..
Sintaxis
boxplot (x, ...) # función genérica
boxplot (fórmula, datos = NULL, ..., subconjunto, na.action = NULL) ## Método S3 para la clase 'fórmula'
boxplot (x, ..., range = 1.5, width = NULL, varwidth = FALSE, notch = FALSE, outline = TRUE, names, plot = TRUE, border = par ("fg"), col = NULL, log = " ", pars = list (boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL) ## Método S3 predeterminado
Parámetros
Parámetros | Detalles (fuente R Documentación) |
---|---|
fórmula | una fórmula, como y ~ grp, donde y es un vector numérico de valores de datos que se dividen en grupos según la variable de agrupación grp (generalmente un factor). |
datos | un data.frame (o lista) de donde se deben tomar las variables en la fórmula. |
subconjunto | un vector opcional que especifica un subconjunto de observaciones que se utilizarán para trazar. |
na.acción | una función que indica lo que debe suceder cuando los datos contienen NA. El valor predeterminado es ignorar los valores faltantes en la respuesta o en el grupo. |
boxwex | Un factor de escala para ser aplicado a todas las cajas. Cuando solo hay unos pocos grupos, la apariencia de la trama se puede mejorar haciendo las cajas más estrechas. |
trama | Si es VERDADERO (el valor predeterminado), se produce un diagrama de caja. Si no, se devuelven los resúmenes en los que se basan los diagramas de caja. |
columna | si col no es nulo, se supone que contiene colores que se utilizarán para colorear los cuerpos de los diagramas de caja. Por defecto están en el color de fondo. |
Cree un diagrama de caja y bigotes con boxplot () {graphics}
Este ejemplo utiliza la función boxplot()
predeterminada y el marco de datos del iris
.
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
Cuadro de caja simple (Sepal.Length)
Crear un gráfico de caja y bigotes de una variable numérica
boxplot(iris[,1],xlab="Sepal.Length",ylab="Length(in centemeters)",
main="Summary Charateristics of Sepal.Length(Iris Data)")
Diagrama de caja de la longitud del sépalo agrupado por especies
Cree una gráfica de caja de una variable numérica agrupada por una variable categórica
boxplot(Sepal.Length~Species,data = iris)
Traer orden
Para cambiar el orden del cuadro en el gráfico, debe cambiar el orden de los niveles de la variable categórica.
Por ejemplo si queremos tener el orden virginica - versicolor - setosa
newSpeciesOrder <- factor(iris$Species, levels=c("virginica","versicolor","setosa"))
boxplot(Sepal.Length~newSpeciesOrder,data = iris)
Cambiar nombres de grupos
Si desea especificar un nombre mejor para sus grupos, puede usar el parámetro Names
. Se toma un vector del tamaño de los niveles de variable categórica.
boxplot(Sepal.Length~newSpeciesOrder,data = iris,names= c("name1","name2","name3"))
Pequeñas mejoras
Color
col
: agrega un vector del tamaño de los niveles de variable categórica
boxplot(Sepal.Length~Species,data = iris,col=c("green","yellow","orange"))
Proximidad de la caja
boxwex
: establece el margen entre cajas.
boxplot(Sepal.Length~Species,data = iris,boxwex = 0.1)
izquierdo boxplot(Sepal.Length~Species,data = iris,boxwex = 0.1)
boxplot(Sepal.Length~Species,data = iris,boxwex = 1)
derecha boxplot(Sepal.Length~Species,data = iris,boxwex = 1)
Vea los resúmenes en los que se basan los diagramas de caja plot=FALSE
Para ver un resumen, debe poner el plot
parámetros en FALSE
.
Se dan varios resultados.
> boxplot(Sepal.Length~newSpeciesOrder,data = iris,plot=FALSE)
$stats #summary of the numerical variable for the 3 groups
[,1] [,2] [,3]
[1,] 5.6 4.9 4.3 # extreme value
[2,] 6.2 5.6 4.8 # first quartile limit
[3,] 6.5 5.9 5.0 # median limit
[4,] 6.9 6.3 5.2 # third quartile limit
[5,] 7.9 7.0 5.8 # extreme value
$n #number of observations in each groups
[1] 50 50 50
$conf #extreme value of the notchs
[,1] [,2] [,3]
[1,] 6.343588 5.743588 4.910622
[2,] 6.656412 6.056412 5.089378
$out #extreme value
[1] 4.9
$group #group in which are the extreme value
[1] 1
$names #groups names
[1] "virginica" "versicolor" "setosa"
Parámetros adicionales del estilo boxplot.
Caja
- boxlty - tipo de línea de caja
- boxlwd - ancho de línea de caja
- boxcol - color de línea de caja
- relleno de caja - colores de relleno de caja
Mediana
- medlty - tipo de línea mediana ("en blanco" para ninguna línea)
- medlwd - ancho de la línea media
- medcol - color de linea mediana
- medpch - punto medio (NA para ningún símbolo)
- medcex - tamaño de punto medio
- medbg - color de fondo del punto mediano
Bigote
- whisklty - tipo de línea de bigotes
- whisklwd - ancho de línea de bigotes
- Whiskcol - Color de línea de bigotes
Grapa
- grapado - tipo de línea de grapa
- staplelwd - ancho de línea de grapado
- staplecol - color de línea de grapa
Outliers
- outlty - tipo de línea atípica ("en blanco" para ninguna línea)
- outlwd - ancho de línea atípico
- Outcol - Color de línea Outlier
- outpch - tipo de punto atípico (NA para ningún símbolo)
- outcex - tamaño de punto atípico
- outbg - color de fondo de punto atípico
Ejemplo
Parcelas predeterminadas y muy modificadas lado a lado
par(mfrow=c(1,2))
# Default
boxplot(Sepal.Length ~ Species, data=iris)
# Modified
boxplot(Sepal.Length ~ Species, data=iris,
boxlty=2, boxlwd=3, boxfill="cornflowerblue", boxcol="darkblue",
medlty=2, medlwd=2, medcol="red", medpch=21, medcex=1, medbg="white",
whisklty=2, whisklwd=3, whiskcol="darkblue",
staplelty=2, staplelwd=2, staplecol="red",
outlty=3, outlwd=3, outcol="grey", outpch=NA
)