特許
J-GLOBAL ID:201303046103989335

偏り述部抽出装置、方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2012-033242
公開番号(公開出願番号):特開2013-171328
出願日: 2012年02月17日
公開日(公表日): 2013年09月02日
要約:
【課題】述部の意味の異なりを識別した適切な偏り述部抽出を行う。【解決手段】述部正規化部20で、2つの文書集合各々に含まれる各文書に対して形態素解析を行い、機能表現意味ラベル辞書28に基づいて、各機能表現に意味ラベルを付与し、不要な機能表現を削除して、述部を正規化する。偏り述部粒度選択部30で、抽出する偏り述部の粒度として「内容語+意味ラベル」か「表層述部」かを選択し、選択された粒度に従って正規化述部を抽出する。偏り述部抽出部40aまたは40bで、選択された粒度に従って抽出された正規化述部を対象に、各述部がどれだけの文書に出現したか(DF)を計算し、各述部のDFを用いて、各述部が抽出対象の文書集合に偏って出現しているか否かを検定するためのχ2値を計算し、χ2値≧閾値の場合には、その述部を偏り述部として抽出する。【選択図】図1
請求項(抜粋):
複数の文書集合に含まれる複数の文書各々を形態素解析した解析結果に基づいて、前記文書各々の述部を抽出すると共に、該述部に含まれる機能表現に該機能表現が表す意味を示すラベルを付与し、該ラベルに基づいて、前記述部が表す出来事の意味に影響を与える機能表現以外を削除することにより、前記文書各々の述部を正規化する述部正規化手段と、 前記形態素解析の解析結果及び前記ラベルに基づく粒度に従った、前記述部正規化手段により正規化された述部の出現頻度、または前記正規化された述部が出現する文書の数に基づいて、前記複数の文書集合のいずれかの文書集合に偏って出現する偏り述部を抽出する抽出手段と、 を含む偏り述部抽出装置。
IPC (2件):
G06F 17/27 ,  G06F 17/30
FI (4件):
G06F17/27 Z ,  G06F17/27 E ,  G06F17/30 170A ,  G06F17/30 220Z
Fターム (2件):
5B091AA15 ,  5B091CA02
引用特許:
出願人引用 (5件)
全件表示
審査官引用 (4件)
全件表示
引用文献:
出願人引用 (1件)
  • 指標編 単なる件数把握からの脱却を目指し成果検証に役立つ新指標の開発進む
審査官引用 (1件)
  • 指標編 単なる件数把握からの脱却を目指し成果検証に役立つ新指標の開発進む

前のページに戻る