Asakusaで迷子・・・

CCCに不参加の同僚の代わりに、Asakusaの講演を聴いてくることになりました。といっても、自分はHadoopDSLもよく知らないので、このままでは報告に困ります。まずいので、少し予習しました。

以下は、自分用メモです。

リソース置き場

下記のページに、関連ドキュメントが集められている。

何はともあれ、PDFのテクニカルペーパーを読む。30ページ弱ある。基幹系バッチがどういう性質のシステムで、実行環境としてHadoopには何が不足していて、Asakusaがどんなアプローチで解決を図るか、といったことが解説されている。

Getting StartedはAWSを使えば楽

AsakusaのAmazon AMIが公開されている。

これを使えば、10分もかからずに、サンプルコードを動かす環境が作れる。インスタンスを立ち上げた段階で、JavaEclipseHadoop、Asakusa、Mavenなどのダウンロード、インストール、環境変数の設定までが完了している。

Getting Startedのやり方

サンプルコードの動かし方は特に書かれていない。付属しているテストコードを実行すると、詳細なログがコンソールに出力される。そこで、テストケースをデバッグ実行で動かしつつ、ログを読んで、何をしているかを把握する。

…動きをざっくり追うくらいしか今はできないけど、今夜はもう諦める。

メモ
  • 使い方が肝心。Asakusa用に書かれたDSLを読んでみよう。
  • コンパイラという言葉がコードにもコメントにも沢山出てくるので混乱する。
  • 主題と関係ないが、テストデータをDBに登録するUtilと、テスト結果確認のUtil(DBのデータとエクセルの期待値を照合する)が分かりやすくて、勉強になる。あとでもう一度読もう。