特許
J-GLOBAL ID:201503098936707435

テキスト処理を用いた社会構造モデルの抽出

発明者:
出願人/特許権者:
代理人 (3件): SK特許業務法人 ,  奥野 彰彦 ,  伊藤 寛之
公報種別:公開公報
出願番号(国際出願番号):特願2013-133181
公開番号(公開出願番号):特開2015-007920
出願日: 2013年06月25日
公開日(公表日): 2015年01月15日
要約:
【課題】複数の異なるテキストデータを用いて特定のキーワードについての社会構造モデルを解析する【解決手段】複数の異なるテキストデータを取得するテキストデータ取得部102と、解析の対象となるキーワードを取得するキーワード取得部104と、それら複数の異なるテキストデータを含むテキストデータ母集団を用いて、そのキーワードによって直接的または間接的に連想される一連の連想単語群を抽出する連想単語群抽出部106と、その一連の連想単語群に含まれる単語同士の連想関係を解析して、そのキーワードによって直接的または間接的に連想される単語間の構造モデルを解析する構造モデル解析部110と、その構造モデルを出力する出力部120と、を備える、テキストデータを解析する情報解析装置1000を提供する。【選択図】図7
請求項(抜粋):
テキストデータを解析する情報解析装置であって、 複数の異なるテキストデータを取得するテキストデータ取得部と、 解析の対象となるキーワードを取得するキーワード取得部と、 前記複数の異なるテキストデータを含むテキストデータ母集団を用いて、前記キーワードによって直接的または間接的に連想される一連の連想単語群を抽出する連想単語群抽出部と、 前記一連の連想単語群に含まれる単語同士の連想関係を解析して、前記キーワードによって直接的または間接的に連想される単語間の構造モデルを解析する構造モデル解析部と、 前記構造モデルを出力する出力部と、 を備え、 前記連想単語群抽出部は、 前記キーワードによって直接連想される1次連想単語を前記テキストデータ母集団から抽出し、さらにt次連想単語(tは1以上の整数、前記キーワードをt=1の場合のt次連想単語とする)によって直接連想される(t+1)次連想単語を前記テキストデー母集団から抽出する連想単語抽出部と、 前記t次連想単語から前記(t+1)次連想単語へのエッジに重みの付与を行う重み付け部と、 を有し、 前記連想単語抽出部は、 前記テキストデータ母集団における、前記t次連想単語を含むテキストデータでの他の同属性の単語の頻度と、前記他の同属性の単語が出現するテキストデータの個数と、の複合指標を、前記t次連想単語によって前記他の同属性の単語が連想される度合を示す連想指標として計算する、連想指標計算部と、 前記テキストデータ母集団から、前記t次連想単語に対する前記連想指標が所定の基準を満たす前記他の同属性の単語を、前記(t+1)次連想単語として抽出する連想指標フィルター部と、 を含む、 情報解析装置。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (4件):
G06F17/30 320D ,  G06F17/30 210A ,  G06F17/30 170A ,  G06F17/27 Z
Fターム (5件):
5B091AA15 ,  5B091CA02 ,  5B091CA12 ,  5B091CC04 ,  5B091EA01

前のページに戻る