データマイニングを始める ①環境構築

そろそろデータマイニングでもやってみるか。
ということで、手始めに書籍「入門ソーシャルデータ」に沿って色々試してみようと思う。
まずは環境構築から。

環境構築

ActivePython 概要
ActivyPython インストール手順

とりあえず、2.xをインストールする。

1. 下記サイトからインストーラをダウンロードし、実行

 (※メニューの「ActivePython 3」>「Which version should I choose?」から辿れる)
 (※今回は ActivePython-2.7.2.5-win64-x64 を選んだ)

以上。

各種パッケージのインストール
  • NetworkX
    • 機能:グラフの生成、分析など?
    • インストールコマンド:
easy_install networkx
    • 動作確認:

コマンド

import networkx
g = networkx.Graph()
g.add_node("a")
g.add_node("b")
g.add_edge("a","b")
print g.nodes()
print g.edges()

期待結果

['a', 'b']
[('a', 'b')]
  • twitter
    • インストールコマンド
easy_install twitter

操作メモ

ドキュメントの参照
  • 方法1: python コマンドを -mpydoc オプションで実行する。

例:

python -mpydoc networkx.Graph
  • 方法2: pythonコンソール内で help コマンドを実行する。

例:

help(networkx.Graph)
  • 方法3: python コマンドを -mpydoc オプション、 -w オプションで実行し、ドキュメントをHTMLに出力する。

例:

python -mpydoc -w networkx.Graph

参考文献

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック