pandas
Herramientas computacionales
Buscar..
Encuentra la correlación entre columnas
Supongamos que tiene un DataFrame de valores numéricos, por ejemplo:
df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])
Entonces
>>> df.corr()
a b c
a 1.000000 0.018602 0.038098
b 0.018602 1.000000 -0.014245
c 0.038098 -0.014245 1.000000
Encontrará la correlación de Pearson entre las columnas. Observe cómo la diagonal es 1, ya que cada columna está (obviamente) completamente correlacionada consigo misma.
pd.DataFrame.correlation
toma un parámetro de method
opcional, especificando qué algoritmo usar. El valor predeterminado es pearson
. Para usar la correlación de Spearman, por ejemplo, use
>>> df.corr(method='spearman')
a b c
a 1.000000 0.007744 0.037209
b 0.007744 1.000000 -0.011823
c 0.037209 -0.011823 1.000000
Modified text is an extract of the original Stack Overflow Documentation
Licenciado bajo CC BY-SA 3.0
No afiliado a Stack Overflow