pandas
ネイティブPythonデータ型でパンダを楽しくする
サーチ…
パンダのデータをネイティブPythonとNumpyのデータ構造に移動する
In [1]: df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.0, 2.0, 3.0], 'C': ['a', 'b', 'c'],
'D': [True, False, True]})
In [2]: df
Out[2]:
A B C D
0 1 1.0 a True
1 2 2.0 b False
2 3 3.0 c True
シリーズからPythonのリストを取得する:
In [3]: df['A'].tolist()
Out[3]: [1, 2, 3]
DataFramesにはtolist()
メソッドがありません。それを試みると、AttributeErrorが発生します。
In [4]: df.tolist()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-4-fc6763af1ff7> in <module>()
----> 1 df.tolist()
//anaconda/lib/python2.7/site-packages/pandas/core/generic.pyc in __getattr__(self, name)
2742 if name in self._info_axis:
2743 return self[name]
-> 2744 return object.__getattribute__(self, name)
2745
2746 def __setattr__(self, name, value):
AttributeError: 'DataFrame' object has no attribute 'tolist'
シリーズから数え切れない配列を取得する:
In [5]: df['B'].values
Out[5]: array([ 1., 2., 3.])
また、データフレーム全体から個々のnumpy配列として列の配列を取得することもできます。
In [6]: df.values
Out[6]:
array([[1, 1.0, 'a', True],
[2, 2.0, 'b', False],
[3, 3.0, 'c', True]], dtype=object)
シリーズから辞書を取得する(インデックスをキーとして使用する):
In [7]: df['C'].to_dict()
Out[7]: {0: 'a', 1: 'b', 2: 'c'}
また、DataFrame全体を辞書として戻すこともできます。
In [8]: df.to_dict()
Out[8]:
{'A': {0: 1, 1: 2, 2: 3},
'B': {0: 1.0, 1: 2.0, 2: 3.0},
'C': {0: 'a', 1: 'b', 2: 'c'},
'D': {0: True, 1: False, 2: True}}
to_dict
メソッドには、辞書のフォーマット方法を調整するためのto_dict
異なるパラメータがあります。各行の辞書のリストを取得するには:
In [9]: df.to_dict('records')
Out[9]:
[{'A': 1, 'B': 1.0, 'C': 'a', 'D': True},
{'A': 2, 'B': 2.0, 'C': 'b', 'D': False},
{'A': 3, 'B': 3.0, 'C': 'c', 'D': True}]
ディクショナリの作成に使用できるオプションの一覧は、ドキュメントを参照してください。
Modified text is an extract of the original Stack Overflow Documentation
ライセンスを受けた CC BY-SA 3.0
所属していない Stack Overflow