特許
J-GLOBAL ID:200903093441605190

テキスト分析装置およびテキスト分析プログラム

発明者:
出願人/特許権者:
代理人 (3件): 志賀 正武 ,  高橋 詔男 ,  青山 正和
公報種別:公開公報
出願番号(国際出願番号):特願2007-133965
公開番号(公開出願番号):特開2008-287638
出願日: 2007年05月21日
公開日(公表日): 2008年11月27日
要約:
【課題】文全体の特徴、前後数文の特徴を基に、その文が説明区間に入るか否かを統計的に判定することのできるテキスト分析装置およびテキスト分析プログラムを提供する。【解決手段】テキスト分析装置が、機械学習処理により得られた素性関数ごとの重要度値からなる学習結果データ記憶部と、複数の文を含む処理対象文章データを読み込み、処理対象文章データに含まれる各々の文を解析して特徴値データを求める特徴抽出部と、前記特徴値データを基に素性関数の値を計算し、学習結果データ記憶部から素性関数ごとの前記重要度値を読み出し、計算された素性関数の値と読み出された重要度値とを基に処理対象文章データに対する出力系列ごとの生起確率値を算出し、算出された前記生起確率値に基づいて一つの出力系列を選択し、この選択された出力系列により前記処理対象文章データ中の特定区間を抽出する判定処理部を備える。【選択図】図1
請求項(抜粋):
機械学習処理により得られた素性関数ごとの重要度値を記憶する学習結果データ記憶部と、 複数の文を含む処理対象文章データを読み込み、前記処理対象文章データに含まれる各々の文を解析して特徴値データを求める特徴抽出部と、 前記特徴値データを基に素性関数の値を計算し、前記学習結果データ記憶部から素性関数ごとの前記重要度値を読み出し、計算された素性関数の値と読み出された重要度値とを基に前記処理対象文章データに対する出力系列ごとの生起確率値を算出し、算出された前記生起確率値に基づいて一つの出力系列を選択し、この選択された出力系列により前記処理対象文章データ中の特定区間を抽出する判定処理部と、 を備えることを特徴とするテキスト分析装置。
IPC (2件):
G06F 17/21 ,  G06F 17/28
FI (3件):
G06F17/21 550A ,  G06F17/28 ,  G06F17/28 U
Fターム (7件):
5B009QA04 ,  5B091AA15 ,  5B091AB00 ,  5B091CA02 ,  5B091EA01 ,  5B091EA25 ,  5B109QA04
引用文献:
前のページに戻る