文献
J-GLOBAL ID:201002296344199310   整理番号:10A1381763

テキストコーパスの概念化に対する概念駆動型の生物医学知識抽出・可視化の枠組

A concept-driven biomedical knowledge extraction and visualization framework for conceptualization of text corpora
著者 (3件):
資料名:
巻: 43  号:ページ: 1020-1035  発行年: 2010年12月 
JST資料番号: B0827A  ISSN: 1532-0464  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
テキスト文書に埋め込まれている情報の抽出や理解を容易にするため,情報抽出や,文書分類,文書クラスタリング,情報可視化などいくつかの技術が開発されてきた。しかし,自然言語テキストに埋め込まれている知識は,簡単なパターンマッチング技術を用いて抽出することが難しい。また,こうした方法の多くは,文書コーパス中の重要概念とそれらの意味関係(それは概念構造を把握する上で重要であるが)をユーザが直接理解するのに役立たない。問題は,計算機では容易には解釈できない非構造化テキストまたは半構造化テキスト内に多くの情報が埋め込まれているという事実から生じる。本論文では,生物医学テキスト文書から重要な情報成分を同定するための,新しい生物医学知識抽出・可視化の枠組「BioKEVis」を提案した。情報成分は重要概念を中心にした。BioKEVisは,重要概念を同定するために言語解析と潜在意味解析(LSA)を利用する。情報成分の抽出原理は,自然言語処理技術と意味論ベースの解析に基づく。また,テキスト中の遺伝子や,蛋白質,他の実体名にタグ付けするため,システムは生物医学固有表現認識器「ABNER」と一体になっている。また,意味ネットワークを生成するために複数の情報源から抽出した情報を照合する方法を提案した。意味ネットワークは,明確なユーザの観点を提供し,類似した情報成分を持つ文書に対するナビゲーションを可能にし,また収集の総合的観点を提供するために使われる。システムは,テキスト文書に対する生物医学上の質問を扱う質問処理モジュールを統合した構造化リポジトリに,抽出された情報成分を蓄える。また,検索された文書をユーザの質問との関連性の順番で提示するための,文書ランク付け機構を提案した。Copyright 2010 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
ドキュメンテーション  ,  ドキュメンテーション  ,  人工知能  ,  自然語処理 

前のページに戻る