pandas                
            Вычислительные инструменты
        
        
            
    Поиск…
Найти корреляцию между столбцами
Предположим, что у вас есть DataFrame числовых значений, например:
df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])
затем
>>> df.corr()
    a    b    c
a    1.000000    0.018602    0.038098
b    0.018602    1.000000    -0.014245
c    0.038098    -0.014245    1.000000
найдет корреляцию Пирсона между столбцами. Обратите внимание, как диагональ равна 1, так как каждый столбец (очевидно) полностью коррелирован с самим собой.
 pd.DataFrame.correlation принимает необязательный параметр method , указав, какой алгоритм использовать. По умолчанию используется pearson . Например, для использования корреляции Спирмена используйте 
>>> df.corr(method='spearman')
    a    b    c
a    1.000000    0.007744    0.037209
b    0.007744    1.000000    -0.011823
c    0.037209    -0.011823    1.000000
Modified text is an extract of the original Stack Overflow Documentation
        Лицензировано согласно CC BY-SA 3.0
        Не связан с Stack Overflow