ワークフローを使った解析サービスサイトの構築

SADI(Semantic Automated Discovery and Integration)を使った各種バイオインフォマティクス計算のセマンティックWeb解析サービスの公共利用サイトの構築経験があります。
入出力のデータフォーマットにオントロジー言語OWLで型定義したRDF(Resource Description Framework)を使用し、各種バイオインフォマティクス計算をcurlコマンドや統合開発環境であるエクリプス上で実行できます。

また、バイオインフォマティクスにおいてある目的の計算する場合、一連の複数の計算処理を行う必要がありますが、その一連の計算を一つのワークフローとして扱うスキームを構築した経験もあります。

このワークフローを、Webベースで実行可能(Webベースワークフロー)なサイトを作成すると同時に、ユーザが計算を目的に応じて組み合わせることによってワークフローを作成できる、Activeワークフロー(ユーザ定義型ワークフロー)も実装しました。

このActiveワークフローでは、可変型ワークフロープラットフォームとしてKNIMEを使用して、一つの計算処理をノードとして、ユーザが目的の計算に応じて、多数のノードを組み合わせて一つのワークフローを、自分のPC上(Windows,Linux,MacOS)で作成します。多数のノードの組み合わせは、エクリプスのGUIを用いて、ノードの絵を見ながら簡単にマウス操作でできます。

また、各ノードは、SOAPで作成したため、ユーザが意識しないでも並列・分散計算を別の計算サーバ上で自動的に実行し、計算量の大きな多数のバイオインフォマティクス計算のパイプライン処理を実現しました。