pandas
Computationele hulpmiddelen
Zoeken…
Zoek de correlatie tussen kolommen
Stel dat u een DataFrame met numerieke waarden hebt, bijvoorbeeld:
df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])
Vervolgens
>>> df.corr()
a b c
a 1.000000 0.018602 0.038098
b 0.018602 1.000000 -0.014245
c 0.038098 -0.014245 1.000000
vindt de Pearson-correlatie tussen de kolommen. Merk op hoe de diagonaal 1 is, want elke kolom is (uiteraard) volledig gecorreleerd met zichzelf.
pd.DataFrame.correlation
een optionele method
parameter specificeert welk algoritme gebruikt. De standaardwaarde is pearson
. Om bijvoorbeeld Spearman-correlatie te gebruiken, gebruikt u
>>> df.corr(method='spearman')
a b c
a 1.000000 0.007744 0.037209
b 0.007744 1.000000 -0.011823
c 0.037209 -0.011823 1.000000
Modified text is an extract of the original Stack Overflow Documentation
Licentie onder CC BY-SA 3.0
Niet aangesloten bij Stack Overflow