수색…


열 사이의 상관 관계 찾기

숫자 값의 DataFrame이 있다고 가정합니다. 예를 들면 다음과 같습니다.

df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])

그때

>>> df.corr()
    a    b    c
a    1.000000    0.018602    0.038098
b    0.018602    1.000000    -0.014245
c    0.038098    -0.014245    1.000000

열 사이의 피어슨 상관 관계 를 찾을 수 있습니다. 대각선이 1 인 방법에 유의하십시오. 각 열은 (명백하게) 자체와 완전히 상호 연관되어 있습니다.

pd.DataFrame.correlation 선택적 얻어 method 사용하는 알고리즘을 지정하는 파라미터. 기본값은 pearson 입니다. Spearman 상관 관계를 사용하려면 예를 들어 다음을 사용합니다.

>>> df.corr(method='spearman')
    a    b    c
a    1.000000    0.007744    0.037209
b    0.007744    1.000000    -0.011823
c    0.037209    -0.011823    1.000000


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow