pandas
Computational Tools
Suche…
Finden Sie die Korrelation zwischen Spalten
Angenommen, Sie verfügen über einen DataFrame mit numerischen Werten. Beispiel:
df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])
Dann
>>> df.corr()
a b c
a 1.000000 0.018602 0.038098
b 0.018602 1.000000 -0.014245
c 0.038098 -0.014245 1.000000
wird die Pearson-Korrelation zwischen den Spalten finden. Beachten Sie, dass die Diagonale 1 ist, da jede Spalte (offensichtlich) vollständig mit sich selbst korreliert ist.
pd.DataFrame.correlation
einen optionalen method
, der den zu verwendenden Algorithmus angibt. Die Standardeinstellung ist pearson
. Verwenden Sie beispielsweise die Spearman-Korrelation
>>> df.corr(method='spearman')
a b c
a 1.000000 0.007744 0.037209
b 0.007744 1.000000 -0.011823
c 0.037209 -0.011823 1.000000
Modified text is an extract of the original Stack Overflow Documentation
Lizenziert unter CC BY-SA 3.0
Nicht angeschlossen an Stack Overflow