pandas
Dołączanie do DataFrame
Szukaj…
Dołączanie nowego wiersza do DataFrame
In [1]: import pandas as pd
In [2]: df = pd.DataFrame(columns = ['A', 'B', 'C'])
In [3]: df
Out[3]:
Empty DataFrame
Columns: [A, B, C]
Index: []
Dołączanie wiersza o wartość jednej kolumny:
In [4]: df.loc[0, 'A'] = 1
In [5]: df
Out[5]:
A B C
0 1 NaN NaN
Dołączanie wiersza, podana lista wartości:
In [6]: df.loc[1] = [2, 3, 4]
In [7]: df
Out[7]:
A B C
0 1 NaN NaN
1 2 3 4
Dołączanie wiersza ze słownikiem:
In [8]: df.loc[2] = {'A': 3, 'C': 9, 'B': 9}
In [9]: df
Out[9]:
A B C
0 1 NaN NaN
1 2 3 4
2 3 9 9
Pierwszym wejściem w .loc [] jest indeks. Jeśli użyjesz istniejącego indeksu, nadpiszesz wartości w tym wierszu:
In [17]: df.loc[1] = [5, 6, 7]
In [18]: df
Out[18]:
A B C
0 1 NaN NaN
1 5 6 7
2 3 9 9
In [19]: df.loc[0, 'B'] = 8
In [20]: df
Out[20]:
A B C
0 1 8 NaN
1 5 6 7
2 3 9 9
Dołącz DataFrame do innej DataFrame
Załóżmy, że mamy następujące dwie ramki danych:
In [7]: df1
Out[7]:
A B
0 a1 b1
1 a2 b2
In [8]: df2
Out[8]:
B C
0 b1 c1
Dwie ramki danych nie muszą mieć tego samego zestawu kolumn. Metoda dołączania nie zmienia żadnej z oryginalnych ramek danych. Zamiast tego zwraca nową ramkę danych, dołączając dwie oryginalne. Dołączenie DataFrame do innej jest dość proste:
In [9]: df1.append(df2)
Out[9]:
A B C
0 a1 b1 NaN
1 a2 b2 NaN
0 NaN b1 c1
Jak widać, możliwe jest posiadanie zduplikowanych indeksów (0 w tym przykładzie). Aby uniknąć tego problemu, możesz poprosić Pandas o ponowne indeksowanie nowej DataFrame dla Ciebie:
In [10]: df1.append(df2, ignore_index = True)
Out[10]:
A B C
0 a1 b1 NaN
1 a2 b2 NaN
2 NaN b1 c1
Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow