pandas
Outils de calcul
Recherche…
Rechercher la corrélation entre les colonnes
Supposons que vous ayez un DataFrame de valeurs numériques, par exemple:
df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])
alors
>>> df.corr()
a b c
a 1.000000 0.018602 0.038098
b 0.018602 1.000000 -0.014245
c 0.038098 -0.014245 1.000000
trouvera la corrélation de Pearson entre les colonnes. Notez que la diagonale est 1, car chaque colonne est (évidemment) entièrement corrélée à elle-même.
pd.DataFrame.correlation
un paramètre de method
facultatif, spécifiant l'algorithme à utiliser. La valeur par défaut est pearson
. Pour utiliser la corrélation de Spearman, par exemple, utilisez
>>> df.corr(method='spearman')
a b c
a 1.000000 0.007744 0.037209
b 0.007744 1.000000 -0.011823
c 0.037209 -0.011823 1.000000
Modified text is an extract of the original Stack Overflow Documentation
Sous licence CC BY-SA 3.0
Non affilié à Stack Overflow