『入門 ソーシャルデータ』9章の発表資料と補足

『入門 ソーシャルデータ』の勉強会で、9章のまとめを発表してきました。

資料はGoogle Groupでシェアしましたが、こちらにも。

9章は理論の話がほとんどありませんでしたね。Facebookのデータに対してできることの例示がメインでした。

スライドにない話や、勉強会で出た話題を補足します。

補足

アクセストークンの取得

p.295のfacebook__login.pyというサンプルコードの中に、リダイレクトの先URIが書かれていますが、これは原著者が作ったアプリのURIです。

もしこのサンプルコードをそのまま使うのであれば、自分でホスティングするアプリのURIに書き換える必要があります。

ホスティングせずにサンプルを動かす方法については、Facebookのアクセストークン取得にまとめました。

余談スライドで喋ったこと

9章で、普段使わないRGraphやSunburstを使ってみて、ソーシャルネットワークの可視化に適したグラフやツールに興味を持ちました。

そこで最近、『ビューティフルビジュアライゼーション』という本を読んでいます。この本の10章が、まさにソーシャルネットワークの可視化を扱っていて、『入門 ソーシャルデータ』の9章と繋がりを感じる内容だったので、話題にしました。

10章では、可視化ツールがインタラクティブであることの重要性が説かれます。データの分析では、「統計的な手法」と、「ビジュアライゼーションでパターンやトレンドを見出すこと」の2つのアプローチが大事だという話があります。なるほど、よくあるグラフのエッジを伸ばしたり移動したりするモーションには、意味があったんだなぁ、と感心しました。

また、ソーシャルネットワークで分析によく使われるタスクとして、「総覧」「ノードのランク付け」「エッジのランク付け」「ノードの表示」「コミュニティの発見」6つが挙げられています。つまり、これらの使い勝手が、ビジュアライゼーションツールの良し悪しを左右しうるわけですね。こういった視点があると、ツールの選定も少しは捗りそうです。


勉強会で出た話題の覚書き

Facebookアプリのherokuホスティング

Facebookで新規にアプリを作るとき、herokuでのホスティングを選べば、サンプルアプリがセットアップされるので、本のサンプルを動かすにもベンリかもしれません。

自習後の成果共有で、Aさんから教えていただきました。

タグクラウド

本文で紹介されている、タグクラウドをぐるぐる動かすライブラリ・WP-Cumulusの意義が分からないと言ったところ、「スペースを節約できるのでは」とIさんから指摘いただきました。なるほど。

Cumulusがブログパーツに組み込まれた動作例(http://crossinthenight.com/wordpress/1593/)を見つけました。こういった使い方をするなら、省スペースには意義がありますね。

ただ、タグクラウドは、タグの大小で語の相対的な重要度を表現できる点が肝なのに、3Dでぐるぐる回してしまうと大きさが分かりづらい、というツッコミも出ていました。たしかにw

まとめ

今回は、そんな感じでした。懇親会にも楽しく参加させてもらいました。

主催のKshi_Kshiさん、会場提供くださったVoyageグループさん、参加された皆さん、ありがとうございました。

個人的な宿題は、Python による日本語自然言語処理http://nltk.googlecode.com/svn/trunk/doc/book-jp/ch12.html)を読んで、日本語のタグクラウドのサンプルコードを動かすことですね。;)