研課題
J-GLOBAL ID:202104010605575722  研究課題コード:7700002924

蛋白質立体構造データベースの高度化

実施期間:2001 - 2005
実施機関 (1件):
研究代表者: ( , 蛋白質研究所, 教授 )
研究概要:
1.背景 世界的なゲノム・プロジェクトの進展によって、1個体を規定する遺伝子の総体であるゲノム情報が、様々な生命体に対して明らかにされつつある。蓄積された膨大な量のゲノム情報が生命活動においてどのような意味を持っているかの解析、すなわち遺伝子型と個体における表現型とを結ぶ作業が、これからのゲノム科学の一つの大きな課題である。特に、現在進められている「構造ゲノム科学」では、解明したい遺伝子情報を、アミノ酸配列からその蛋白質立体構造として理解し、立体構造に基づいたその分子の生化学的機能と蛋白質間相互作用の解析を通じて、個体の生命活動までを記述しようとする。国内外で5年~7年の間に、全ファミリーを代表する立体構造として約1万種類の蛋白質立体構造を決定しようとする構造ゲノム科学プロジェクトが推進されており、日本でも、科学技術会議が、この構造ゲノム科学とその支援体制構築の重要性を提言している(平成12年11月17日「構造ゲノム科学研究における我が国の戦略について」科学技術会議ライフサイエンス部会ゲノム科学委員会)。そのアウトプットとしての蛋白質立体構造情報は、それゆえ、たいへん重要な位置づけにあり、ゲノムの配列情報と、蛋白質機能の情報、個体の表現型の情報がクロス・オーバーする「キー」となるべき位置に、蛋白質立体構造データベースが存在している。 2.蛋白質立体構造データベースの現状 世界中の構造生物学の研究者が決定した様々の蛋白質の立体構造は、蛋白質立体構造データベースに整理されて蓄積されてきた。歴史的には、PDB(Protein Data Bank)と呼ばれるデータベースが、1971年に誕生して以来、米国Brookhaven National Laboratory (BNL)が管理・運営を1999年5月まで継続してきた。しかし、1999年6月から、Rutgers大学、San Diego Supercomupter Center(SDSC)、National Institute of Standards and Technology(NIST)の3者が協力して運営するResearch Collaboration for Structural Bioinformatics(RCSB) という組織が、BNLに替わって管理・運営を開始した。このデータベース維持のため、RCSBはNational Science Foundation(NSF)から1千万ドル、5年間のグラントをもらい、Rutgersに13名、SDSCに11名、NISTに8名、総勢32名の規模で、プロジェクトを進めている。RCSBにおけるデータベース運営の最も大きな特徴は、RCSBでは、管理・運営を合理化したのみでなく、データ・フォーマットの変更、自動登録ソフトの開発など、登録者および閲覧者の利用の簡便化等を進めている。データの量は近年急速に増加し、 2000年末までには1万4千件近い量の立体構造データが登録され、公開されている。登録数は、米国からは約50%、ヨーロッパからは30%、アジアから は10%でその半分ほどが日本からだと言われている。具体的には、2000年の第一四半期では、登録全数587件のうち、アジア・オセアニア地区からは89件(15%)、その内日本からは43件(7.3%)であった。一方、EBI(European Bioinformatics Institute)では、MSD(Macromolecular Structure Database) プロジェクトというのを、PDBとは独立したデータベース管理システムとしてスタートさせている。日本では、大阪大学蛋白質研究所・立体構造データ解析研究系が、米国PDBデータベースのアジア・オセアニア地区での公式のアーカイブとして、RCSBと協力してデータベース管理・運営を行っており、特に2000年7月からは、日本国内はもとよりアジア・オセアニア地区の構造生物学者が解析した立体構造情報の新規登録作業を開始し、2001年2月末までに179件の新規データの登録作業を行った。しかし、その運営体制はRCSBに比べるとたいへん貧弱であり、2名の専門編集委員が作業を行っており、その運営資金は、科学技術振興事業団の計算科学技術活用型特定研究開発推進事業「蛋白質立体構造データベースの構築と利用システムの開発」研究費(平成10年後期-平成13年後期)にのみ依存している。ところで、NMRによって決定された立体構造もPDBには登録されているが、単なる分子の構造以外にも、各蛋白質中で同定された炭素、窒素、水素の各スピンの化学シフト情報が、BioMagResBank (BMRB) というデータベースに集積されている。これは、Wisconsin大学のJohn L. Markleyによって1996年からスタートしたものである。このデータベースに対しては、日本国内で対応し国際協力を行っている所が未だにないが、やはり大阪大学蛋白質研究所でその対応を進めている所である。 3.研究開発「蛋白質立体構造データベースの高度化」の意義 現在までのPDBデータベースは、構造生物学研究の成果をまとめあげたデータベースであったが、今後の構造ゲノム科学とそのプロジェクトの進展によって、ゲノム情報との結びつきがさらに強まり、大きな付加価値が付け加わって、産業的価値も高まるものと思われる。具体的には、以下の意義がある。 (1)ゲノム中の各遺伝子に対応する蛋白質について、その立体構造、あるいは既に立体構造の決定された類似の蛋白質構造から得られる立体構造モデルがデータベースから理解でき、ゲノム情報の構造を通した理解が進み、遺伝子の情報がどのようなメカニズムで機能発現に関わっているかについての合理的な解釈が可能となり、構造ゲノム科学の成果を統合化できる。 (2)ゲノム中の各遺伝子に対応する蛋白質の構造(高分解能)を決定する場合に、上記したモデル構造あるいは既に立体構造の決定された相同蛋白質の構造を利用することで、迅速な構造決定がなされる。 (3)ゲノム中の各遺伝子に対応する蛋白質の機能を理解するため、相互作用する相手の分子との複合体構造の構造決定が迅速で高精度になされる。 (4)創薬開発の効率化が進む。これまで、薬物設計において、ランダムに試行を繰り返す帰納的方法の方が、ドラッグ・デザインにおける構造からの演繹的薬物設計に対して有効であった。しかし、ランダム・スクリーニングでは作用点の探索・確認の効率が悪い。立体構造データベースの活用によって、これら蛋白質の立体構造を基に、物理化学を基礎においた薬物設計が急速に進展することが期待される。 (5)バイオインフォーマティクスを活用した構造データと機能データとを結ぶ帰納的な方法が開発されれば、「構造」と「機能」のギャップを埋めることができ、ゲノム科学をさらに進展することができる。 (6)科学的価値および産業的価値の高い蛋白質立体構造データベースを、国際的に協力して運営し高度化していくことによって、科学技術における日本の寄与を定量的に示すことができる。 (7)現在整備されているPDBは、研究者の間でのみ使われており、必ずしも高校生あるいは大学学部生にとっての教育用を目的としたものではない。本研究開発課題の中の一部に、データベースの高度化とともに教育用データベースも開発しておくことによって、将来の人材育成にも役立たせる。
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した研究課題タイトルの用語をもとにしたキーワードです
研究制度:
上位研究課題: 生命情報データベースの高度化・標準化
研究所管機関:
国立研究開発法人科学技術振興機構

前のページに戻る