DDBJデータ解析チャレンジ実施委員会が主催の、DDBJデータ解析チャレンジ2016 : 「DNA配列からのクロマチン特徴予測」において最優秀賞を受賞しました。

コンテストは、シロイヌナズナDNA配列から、遺伝子発現のオンオフに深く関係するクロマチン特徴領域を、機械学習を用いて予測する際の、予測モデルの精度で競われ、
データサイエンス・コンペティションのプラットフォームであるビッグデータ大学(京都大学)に投稿する形で実施されました。

予測モデルを作成するために使用したソフトウェアは、
すべてのスクリプトは、Python 3.5 で記述、
Extremely Randomized Trees 法の実装には Scikit-learn ver.0.17.1
Convolutional Neural Network の実装には Chainer ver.1.10.0
です。

開発したモデルの詳細については今後文献発表されると思いますが、内容の概要はこちら(DDBJデータ解析チャレンジ受賞者の発表)で確認できます。

開発した手法は今後、ヒトなど他の生物種での予測でも応用可能であると考えています。

※ DDBJ : 国立遺伝学研究所 日本DNAデータバンク