特許
J-GLOBAL ID:200903056758840663

テキスト分析装置及びテキスト分析プログラム

発明者:
出願人/特許権者:
代理人 (3件): 志賀 正武 ,  高橋 詔男 ,  青山 正和
公報種別:公開公報
出願番号(国際出願番号):特願2007-067267
公開番号(公開出願番号):特開2008-226162
出願日: 2007年03月15日
公開日(公表日): 2008年09月25日
要約:
【課題】複数の文を対象として文章区間を抽出するために、学習データに基づく学習処理の結果を用いることが出来るようにする。またその学習処理の時間を短縮する。【解決手段】テキスト分析装置が、最終仮説情報を記憶する最終仮説情報記憶部と、学習データを構文解析した結果に基づき木構造を生成する第1木構造生成部と、生成された木構造から複数の部分木を抽出して弱学習器を生成する弱学習器生成部と、生成された複数の弱学習器を基にギブスブースト学習アルゴリズムによる学習処理を行なって最終仮説情報を作成する学習処理部と、判定対象のテキストデータからテキストデータに含まれる文章区間に対応する木構造を生成する第2木構造生成部と、この木構造と前記最終仮説情報とに基づき、文章区間が検索対象に該当するか否かを判定する判定処理部を備える。【選択図】図1
請求項(抜粋):
学習の結果得られる最終仮説情報を記憶する最終仮説情報記憶部と、 検索対象であるか否かの情報を含む学習データを構文解析した結果に基づき木構造を生成する第1木構造生成部と、 生成された前記木構造から複数の部分木を抽出して各部分木に対応する弱学習器を生成する弱学習器生成部と、 前記学習データを用いて、生成された複数の前記弱学習器を基にギブスブースト学習アルゴリズムによる学習処理を行なって最終仮説情報を作成し、この最終仮説情報を前記最終仮説情報記憶部に書き込む学習処理部と、 判定対象のテキストデータを構文解析した結果に基づき前記テキストデータに含まれる文章区間に対応する木構造を生成する第2木構造生成部と、 前記第2木構造生成部が生成した木構造と前記最終仮説情報記憶部から読み出した前記最終仮説情報とに基づき、前記文章区間が前記検索対象に該当するか否かを判定する判定処理部と、 を備えることを特徴とするテキスト分析装置。
IPC (2件):
G06F 17/27 ,  G06F 17/30
FI (2件):
G06F17/27 M ,  G06F17/30 419A
Fターム (10件):
5B075ND03 ,  5B075ND35 ,  5B075NK32 ,  5B075UU06 ,  5B091AA15 ,  5B091CA05 ,  5B091CA12 ,  5B091CA14 ,  5B091EA01 ,  5B091EA02
引用文献:
前のページに戻る