R Language
boxplot
Zoeken…
Syntaxis
boxplot (x, ...) # generieke functie
boxplot (formule, data = NULL, ..., subset, na.action = NULL) ## S3-methode voor klasse 'formule'
boxplot (x, ..., range = 1.5, width = NULL, varwidth = FALSE, notch = FALSE, outline = TRUE, names, plot = TRUE, border = par ("fg"), col = NULL, log = " ", pars = list (boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL) ## Standaard S3-methode
parameters
parameters | Details (bron R-documentatie) |
---|---|
formule | een formule, zoals y ~ grp, waarbij y een numerieke vector is van gegevenswaarden die in groepen moeten worden opgesplitst volgens de variabele grp van de groep (meestal een factor). |
gegevens | een data.frame (of lijst) waaruit de variabelen in de formule moeten worden genomen. |
subgroep | een optionele vector die een subset van observaties specificeert die voor het plotten moet worden gebruikt. |
na.action | een functie die aangeeft wat er moet gebeuren als de gegevens NA's bevatten. De standaardinstelling is om ontbrekende waarden in het antwoord of de groep te negeren. |
boxwex | een schaalfactor die op alle vakken moet worden toegepast. Wanneer er slechts enkele groepen zijn, kan het uiterlijk van de plot worden verbeterd door de vakken smaller te maken. |
verhaal | als TRUE (de standaardinstelling) wordt een boxplot geproduceerd. Zo niet, dan worden de samenvattingen waarop de boxplots zijn gebaseerd geretourneerd. |
col | als col niet nul is, wordt aangenomen dat deze kleuren bevat die moeten worden gebruikt om de lichamen van de boxplots te kleuren. Standaard hebben ze de achtergrondkleur. |
Maak een box-and-whisker plot met boxplot () {graphics}
In dit voorbeeld wordt de standaard boxplot()
-functie en het iris
gegevensframe gebruikt.
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
Eenvoudige boxplot (Sepal. Lengte)
Maak een box-and-whisker grafiek van een numerieke variabele
boxplot(iris[,1],xlab="Sepal.Length",ylab="Length(in centemeters)",
main="Summary Charateristics of Sepal.Length(Iris Data)")
Boxplot van kelkbladlengte gegroepeerd per soort
Maak een boxplot van een numerieke variabele gegroepeerd door een categorische variabele
boxplot(Sepal.Length~Species,data = iris)
Breng orde
Om de volgorde van het vak in de plot te wijzigen, moet u de volgorde van de niveaus van de categorische variabele wijzigen.
Als we bijvoorbeeld de volgorde virginica - versicolor - setosa
newSpeciesOrder <- factor(iris$Species, levels=c("virginica","versicolor","setosa"))
boxplot(Sepal.Length~newSpeciesOrder,data = iris)
Wijzig groepsnamen
Als u een betere naam voor uw groepen wilt opgeven, kunt u de parameter Names
. Het neemt een vector van de grootte van de niveaus van categorische variabele
boxplot(Sepal.Length~newSpeciesOrder,data = iris,names= c("name1","name2","name3"))
Kleine verbeteringen
Kleur
col
: voeg een vector toe met de grootte van de niveaus van categorische variabele
boxplot(Sepal.Length~Species,data = iris,col=c("green","yellow","orange"))
Nabijheid van de doos
boxwex
: stel de marge tussen dozen in.
Linker boxplot(Sepal.Length~Species,data = iris,boxwex = 0.1)
Rechter boxplot(Sepal.Length~Species,data = iris,boxwex = 1)
Bekijk de samenvattingen waarop de boxplots zijn gebaseerd plot=FALSE
Om een samenvatting te zien moet je de paramater plot
op FALSE
.
Verschillende resultaten worden gegeven
> boxplot(Sepal.Length~newSpeciesOrder,data = iris,plot=FALSE)
$stats #summary of the numerical variable for the 3 groups
[,1] [,2] [,3]
[1,] 5.6 4.9 4.3 # extreme value
[2,] 6.2 5.6 4.8 # first quartile limit
[3,] 6.5 5.9 5.0 # median limit
[4,] 6.9 6.3 5.2 # third quartile limit
[5,] 7.9 7.0 5.8 # extreme value
$n #number of observations in each groups
[1] 50 50 50
$conf #extreme value of the notchs
[,1] [,2] [,3]
[1,] 6.343588 5.743588 4.910622
[2,] 6.656412 6.056412 5.089378
$out #extreme value
[1] 4.9
$group #group in which are the extreme value
[1] 1
$names #groups names
[1] "virginica" "versicolor" "setosa"
Aanvullende boxplot-stijlparameters.
Doos
- boxlty - boxlijntype
- boxlwd - dooslijnbreedte
- boxcol - boxlijnkleur
- boxfill - opvulkleuren
Mediaan
- medlty - mediaan lijntype ("blanco" voor geen lijn)
- medlwd - mediaanlijn widht
- medcol - gemiddelde lijnkleur
- medpch - mediaanpunt (NA voor geen symbool)
- medcex - mediane puntgrootte
- medbg - mediaan punt achtergrondkleur
snorhaar
- whisklty - type snorhaarlijn
- whisklwd - breedte van de whiskerlijn
- whiskcol - kleur snorhaarlijn
Nietje
- nietjes - type nietlijn
- staplelwd - nietjeslijnbreedte
- staplecol - nietjeslijnkleur
uitschieters
- outlty - uitschieter lijntype ("leeg" voor geen regel)
- outlwd - uitschieter lijnbreedte
- outcol - uitschieter lijnkleur
- outpch - type uitbijterpunt (NA voor geen symbool)
- outcex - puntgrootte van uitbijter
- outbg - achtergrondkleur uitbijterpunt
Voorbeeld
Standaard en sterk gewijzigde plots naast elkaar
par(mfrow=c(1,2))
# Default
boxplot(Sepal.Length ~ Species, data=iris)
# Modified
boxplot(Sepal.Length ~ Species, data=iris,
boxlty=2, boxlwd=3, boxfill="cornflowerblue", boxcol="darkblue",
medlty=2, medlwd=2, medcol="red", medpch=21, medcex=1, medbg="white",
whisklty=2, whisklwd=3, whiskcol="darkblue",
staplelty=2, staplelwd=2, staplecol="red",
outlty=3, outlwd=3, outcol="grey", outpch=NA
)