Asakusaで迷子・・・
CCCに不参加の同僚の代わりに、Asakusaの講演を聴いてくることになりました。といっても、自分はHadoopもDSLもよく知らないので、このままでは報告に困ります。まずいので、少し予習しました。
以下は、自分用メモです。
リソース置き場
下記のページに、関連ドキュメントが集められている。
何はともあれ、PDFのテクニカルペーパーを読む。30ページ弱ある。基幹系バッチがどういう性質のシステムで、実行環境としてHadoopには何が不足していて、Asakusaがどんなアプローチで解決を図るか、といったことが解説されている。
Getting StartedはAWSを使えば楽
AsakusaのAmazon AMIが公開されている。
これを使えば、10分もかからずに、サンプルコードを動かす環境が作れる。インスタンスを立ち上げた段階で、Java、Eclipse、Hadoop、Asakusa、Mavenなどのダウンロード、インストール、環境変数の設定までが完了している。
Getting Startedのやり方
サンプルコードの動かし方は特に書かれていない。付属しているテストコードを実行すると、詳細なログがコンソールに出力される。そこで、テストケースをデバッグ実行で動かしつつ、ログを読んで、何をしているかを把握する。
…動きをざっくり追うくらいしか今はできないけど、今夜はもう諦める。