資源
J-GLOBAL ID:201410068070793896   研究資源コード:NBDC00470 更新日:2019年11月24日

GENIA Project

GENIA Project
保有機関:
資源分類: データ・データベース
タグ【データの種類】 (1件): オントロジー/用語/命名法
概要:
科学技術分野における情報の洪水を克服するために科学者の書いた文章から有用な情報を抽出することを目的としたGENIA Project のサイトです。プロジェクトで作られた以下のリソースやツールについて、データマイニングの手順詳細、具体例、フォーマット情報などを収録しています。データは、BioNLP Shared Task形式でダウンロードできます。
・GENIA corpus
プロジェクトで収集、アノテーションされた生物医学関連の文献コレクションです。「ヒト」「血液細胞」「転写因子」のMeSH タームで抽出したMedlineのアブストラクトにさまざまなレベルの言語情報、セマンティック情報を付与しています。
・Other GENIA Project corpora
GENIA / BioNLP共有タスクイベント表現の拡張機能を使用してアノテーションした
DNAメチル化、網羅的PTM (タンパク質修飾)、mTOR パスウェイ、T4SS(タイプIV分泌システム)のイベントコーパスです。
作成機関: NBDC
レコード管理者: Integbio Database Catalog
本レコードの利用条件: Creative Commons CC0 license

前のページに戻る