pandas
Strumenti computazionali
Ricerca…
Trova la correlazione tra le colonne
Supponiamo di avere un DataFrame di valori numerici, ad esempio:
df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])
Poi
>>> df.corr()
a b c
a 1.000000 0.018602 0.038098
b 0.018602 1.000000 -0.014245
c 0.038098 -0.014245 1.000000
troverà la correlazione di Pearson tra le colonne. Nota come la diagonale è 1, poiché ogni colonna è (ovviamente) pienamente correlata con se stessa.
pd.DataFrame.correlation
accetta un parametro di method
opzionale, specificando quale algoritmo utilizzare. L'impostazione predefinita è pearson
. Per usare la correlazione di Spearman, ad esempio, usa
>>> df.corr(method='spearman')
a b c
a 1.000000 0.007744 0.037209
b 0.007744 1.000000 -0.011823
c 0.037209 -0.011823 1.000000
Modified text is an extract of the original Stack Overflow Documentation
Autorizzato sotto CC BY-SA 3.0
Non affiliato con Stack Overflow