Pandas:python用データ解析ライブラリ
Intro
今まで研究ではデータ解析をするのにMatlab*1を使用していたのですが、これは有償なので個人的な趣味に使用するのには難しいです。
そのため、データ解析をできるフリーソフトを探しました。条件として以下を満たす探して見ました。
- 無償
- データの入出力が楽そう
- スクリプト言語
無料のデータ解析ソフトだとR*2が有名だと思いますが、上記の2の項目に不満が出てきそうです。
そのため、データの入出力はpython、解析をRで行い、互換のあるデータ形式(JSON等)で
やり取りをする*3ことを考えたのですが、たまたまpythonでもデータ解析を行うライブラリPandas*4が存在することが分かったのでinstallしてみました。
Install 方法 (Ubuntu 12.04)
official*5の通り、
sudo apt-get install python-pandas
で大丈夫でした。その後、pythonを起動して
import pandas
とすれば良いようです。まだできたばかりで使い勝手が良いのか怪しいですし、referenceも少ないみたいですが、簡単に準備できたのでちょっと遊んでみようと思います。
また、書籍として
Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,小林儀匡,鈴木宏尚,瀬戸山雅人,滝口開資,野上大介
- 出版社/メーカー: オライリージャパン
- 発売日: 2013/12/26
- メディア: 大型本
- この商品を含むブログ (5件) を見る