Proj
J-GLOBAL ID:202104004811972983  Research Project code:7700002923

シグナルオントロジーとバイオタームバンクの開発

シグナルオントロジーとバイオタームバンクの開発
Study period:2001 - 2005
Organization (1):
Principal investigator: ( , 医科学研究所, 教授 )
Research overview:
基本構想 1-1 ゲノムサイエンスにおけるオントロジー開発の必要性 あいつぐモデル生物のゲノム配列決定により、従来のひとつのモデル生物を対象とする研究から、生物界全体を対象とする新しい研究が産まれつつある。モデル生物種間の比較解析による新しい生命科学の知識発見のためには、これまで蓄積された膨大なデータを生物界全体で統合して捉え直し、これまで開発された様々な解析技術を効果的に適用できるように、研究環境を整えることが求められる。 オントロジーは、データと解析技術の効果的な利用環境を整えるための情報技術である。オントロジーは、対象とする分野のデータの特徴を抽出し(概念化)、概念の性質や互いの関係を明示的に定義したものである。オントロジーを定義することにより、分野の知識と解析技術を明確に分離することができ、両者を独立に再利用することが容易となる。 ゲノムサイエンスにおけるオントロジーの開発は、これまでモデル生物ごとに蓄積されてきた知識を洗い直し、生物の共通の知識を抽出し(概念化)、その知識の性質と関係を記述することで、生命科学の概念の仕様書をつくることである。生命科学における研究分野は多岐に渡っているので、各々の研究分野に応じた複数のオントロジーが必要とされるが、我々は本プロジェクトにおいて、シグナル伝達系と、生体科学の用語、を対象としたオントロジーを開発する。 1-2 シグナル伝達系のオントロジーとデータベース シグナル伝達系は、多細胞生物における、発生、分化、成長、運動、日周期の調整、生体異物応答、ストレス応答といった、さまざまな生体作用を制御するシステムである。シグナル伝達応答の特徴は、単独の分子ではなく、パスウェイあるいはネットワークという多数の分子の相互作用によって制御されることにある。 ゲノムサイエンスにおけるパスウェイ研究の重要性は、解析されたモデル生物の遺伝子総数が予想より少なかった事実から、強調されるようになった。現在のところ、ヒトの遺伝子総数は約4万個で、線虫の2倍、ショウジョウバエの3倍であると見積もられている。この結果は、生物進化における機能獲得については、新規の遺伝子の創出よりもむしろ、分子間相互作用の多様性の創出が本質的であることを示唆している。また産業応用の視点からもパスウェイ研究は注目されている。微生物のパスウェイデータベースは、微生物を利用した化合物生産のための情報源として、また工業廃棄物の環境における 分解反応の情報源として、利用価値が高い。また医学・薬学においては、より作用範囲が限定された副作用の少ない治療法の開発のために、生体内パスウェイ情報に基づく、生体反応を総合的に考慮した新しい創薬が必要、との認識が高まっている。パスウェイ研究において、代謝系については、シソーラス、オントロジー、データベース、情報解析技術の開発が活発に進められている。一方シグナル伝達系については、研究の進行が遅れている。シグナル伝達系のオントロジーの開発は、この現状を打開し、シグナル伝達系の情報学的研究の推進に貢献すると考えられ る。シグナル伝達系のオントロジーが完成すれば、世界で初めての成果となる。 平行して、シグナル伝達系のデータベース開発を行う。データベースはオントロジーのインスタンスあるいは外延である。オントロジーによって定義付けられた概念は、実在する分子の性質や関係にインスタン化されることで、初めて解析技術を適用し得る。インスタン化は、シグナル伝達系を構成する全分子を対象としなくてはならないので、開発には多大な労力が掛かる。小規模の研究室や営利団体では達成し難い研究課題であり、本プロジェクトのような大規模な公的資金で実施されることが望ましい。前述のとおりシグナル伝達系のデータベースも開発が遅れており、その完成は、全世界のゲノム研究と産業界両方から期待が寄せられている。 我々はシグナル伝達系のオントロジーおよびデータベース開発において、この系を表現する新しいモデルを提案している。これまでは、この系を「シグナル」という何らかの作用が伝搬するというモデルが使われていたが、シグナル伝達系パスウェイ研究の遅延は、このモデルの限界にあると考えられる。我々は、生物種間で共通な反応のグループを単位としたモデルを提案し、すでに一部を開発して一般に公開している。本プロジェクトでは、SIGNAL-ONTOLOGYの開発をさらに進めるとともに、SIGNAL-ONTOLOGYの外延となるシグナル伝達のデータベースを開発する。 1-3 生命科学の用語のオントロジーとデータベース 生物界全体を対象とした新しいゲノムサイエンスのためには、各モデル生物に分かれて開発されてきたゲノムデータベースの、統合が必要である。ゲノムデータベースの統合的利用と解析の環境整備として、オントロジーが必要とされている。分子の生体機能に関してゲノムデータベースを統合的利用するためのオントロジーは、Gene Ontology のグループが先行して開発を進めている。我々の研究室ではタンパク質の分子名に関するテキストマイニング研究を行っており、この研究実績を生かして、分子の名称を対象としたオントロジーを開発する。同時にオントロジーの外延である データベースを併せて開発する(BioTerm Bank)。 BioTerm Bankが対象とする分子の名称は、Gene Ontologyが対象とする分子の機能に比較すると、かなりシンプルである。しかしシンプルであるが故に一般の研究機関では研究対象として設定し難く、必要性の高さにも関わらず、未だ世界中で利用できる形で公開されているものはない。したがってBioTerm Bankの開発は、本プロジェクトのように大規模な公的資金を利用したデータベース開発に相応しい課題である。またゲノム研究を支える基盤データベースと して、これまで少なかった日本からの貢献を増やし、ゲノムサイエンスにおける日本の国際地位の向上にも寄与すると考えられる。BioTerm Bankはデータベースの統合だけでなく、生物学のテキストマイニングの知識基盤としても役立つ。
Terms in the title (3):
Terms in the title
Keywords automatically extracted from the title.
Research program:
Parent Research Project: 生命情報データベースの高度化・標準化
Organization with control over the research:
Japan Science and Technology Agency

Return to Previous Page