|
|
研究は主として、バイオ系、IT系の2つで実施した。以下に主な成果を示す。
・ 研究概要:バイオ系
- 進化的計算手法を用いた遺伝子ネットワーク推定システムの設計・開発
2007 年度は、成功率(精度)を向上させるために、複数のデータ系列を与え、それらを同時に
再現する方程式を推定できるようにシステムを改良し、与えるデータ系列を増やすことによっ
て、成功率(精度)が向上するか調べた。ここで複数のデータ系列は、式(1)を解く際の初期値を
変えることによって作成した。その結果、与えたデータ系列数と50 試行中の成功数の関係は
表1 のようになり、データ系列数2, 3, 4 で得られた最良の方程式は、それぞれ式(3), 式(4), 式
(5)となった。表1 を見ると、データ系列数を増やすことによって成功数が増加しており、また
得られた方程式もデータ系列1 つ(式(2))よりもデータ系列数4 つ(式(5))の方がより元の式(式
(1))に近い形で導出することができた。
- 創薬支援のための膜タンパク質配列─立体構造情報の統合データベースの構築
タンパク質を「理解」するためには、アミノ酸配列・機能・構造の相関を得ることが重要で
ある。そこで、国際標準であるSWISS-PROT(タンパク質名・機能・細胞内局在・翻訳後修
飾・アミノ酸配列などの基本情報が整理された公共データベース)と、PDB(生体高分子の立
体構造の原子座標と、その構造が得られた際の実験方法・解像度・アミノ酸/核酸配列などが格
納された公共データベース)に登録されている各エントリー情報を統合する(帰属する)シス
テムを設計・開発する必要がある。
また、これらのデータベースはそれぞれ頻繁に更新を行うため、情報統合のステップをでき
る限り短時間かつ簡便に行う必要がある。さらに、この中から機能異常が重篤な疾病を引き起
こすため創薬分野における研究開発における重要なターゲットであり、シグナル伝達、物質輸
送、エネルギー変換など細胞活動の重要な機能を担っている膜タンパク質の情報だけを正確に
判別・収集することが困難であることから、膜タンパク質の配列と立体構造を自動的に帰属す
るシステムの設計・開発を行った 。
計算実行環境は、産業技術総合研究所 生命情報工学研究センターが管理・運用している並列
計算機Magi システムを利用した。
2007 年度は、帰属システムのプログラム構築を行った。具体的なポイントを以下に示す。
(1)PDB に誤ったフォーマットで登録されているエントリーへの対応。
(2)生物種名が記載されていないPDB チェインに対してNCBI PDBeast からの生物種名に関す
るアノテーションの抽出・引用。
(3)人工的改変タンパク質構造エントリーへの改変前状態へのアミノ酸配列情報の操作。
また、全体構成図を以下に示す。
- マルチプルアラインメントアルゴリズムの高速化と高精度化
2007 年度は精度低下を最小限に抑えたヒューリスティック手法を提案し、PRIME に実装した。
ヒューリスティックのアイディアとしては、保存度の高い領域や反復改善前後で同一の領域に対す
る計算を省略することで計算を削減するというものである。評価実験の結果、精勤の精度低下を2%
未満に抑えて最大で2.9 倍の高速化を実現した。
高速化だけでなく、精度面での高精度化についても検討を行った。具体的にはmaximal expected
accuracy (MEA)法の導入によりアラインメント精度が向上するか評価した。MEA 法では、確率モ
デルの一つであるペアHMM と呼ばれる隠れマルコフモデルを用いてアラインメントを計算する。
通常の動的計画法による方法と異なり、MEA 法ではアラインメントされる配列全体の情報を利用
して計算を行うことが特徴となっている。評価実験の結果、区分的線形ギャップコストを用いた通
常の場合よりもおおむね高精度であることが分かった。
・ 研究概要:IT系
- 検索エンジンのランキング比較
昨年度開発システムが、経済産業省情報大航海プロジェクトの一部の成果としてPConline をは
じめ複数の記事に掲載された。なお、以下は幕張メッセで開催されたCEATEC2007 への展示出品
時のものである。
研究としては、昨年度開発したシステムを用い2006 年度後半から約1年間かけて約1 週間
毎のランキング変動調査を実施した。
- 改変画像検知手法の精度向上
昨年度開発した改変画像検知手法をよりよいものとするため、日本写真著作権協会等とのミ
ーティングを重ねた。また、検索エンジン会社への適用についてもミーティングを重ね、2008
年度から共同研究がスタートする予定である。
なお、2007 年度からは画像処理をコンピュータ上で行う専門家であるマイクロソフトの川西
先生に客員教員として加わっていただき、研究を推進している。
・ 講演会等
- 2007年4月5日 見学会 場所:産総研生命情報科学研究センター
- 2007年6月6日 日本ユニシスとの協業相談 場所:日本ユニシス
- 2007年12月4日 講演会 場所:早大・理工 52号館204教室
並列計算機を用いたバイオインフォマティクス
講師:野口 保(産業技術総合研究所
・受賞
- 2007年7月 平手勇宇(IT バイオ研究所研究員)、情報処理学会、コンピュータサイエンス領域奨励賞
・報道等
- 2007年11月5日 日経産業新聞 8面「早大、類似画像素早く検索」
・論文等はこちら⇒ 2007年度論文.pdf
|