Buscar..


Encuentra la correlación entre columnas

Supongamos que tiene un DataFrame de valores numéricos, por ejemplo:

df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])

Entonces

>>> df.corr()
    a    b    c
a    1.000000    0.018602    0.038098
b    0.018602    1.000000    -0.014245
c    0.038098    -0.014245    1.000000

Encontrará la correlación de Pearson entre las columnas. Observe cómo la diagonal es 1, ya que cada columna está (obviamente) completamente correlacionada consigo misma.

pd.DataFrame.correlation toma un parámetro de method opcional, especificando qué algoritmo usar. El valor predeterminado es pearson . Para usar la correlación de Spearman, por ejemplo, use

>>> df.corr(method='spearman')
    a    b    c
a    1.000000    0.007744    0.037209
b    0.007744    1.000000    -0.011823
c    0.037209    -0.011823    1.000000


Modified text is an extract of the original Stack Overflow Documentation
Licenciado bajo CC BY-SA 3.0
No afiliado a Stack Overflow