特許
J-GLOBAL ID:201103060188224390
情報分析装置、情報分析方法、及びプログラム
発明者:
,
,
出願人/特許権者:
代理人 (1件):
特許業務法人ワンディーIPパートナーズ
公報種別:公開公報
出願番号(国際出願番号):特願2009-225417
公開番号(公開出願番号):特開2011-075707
出願日: 2009年09月29日
公開日(公表日): 2011年04月14日
要約:
【課題】テキストにおける語の出現頻度及び語の属性に影響されることなく、弊害語を特定し得る、情報分析装置、情報分析方法、及びプログラムを提供する。【解決手段】情報分析装置30は、分析対象テキスト11と共通のトピックを含む補助テキスト12を用いて、分析対象テキスト11を構成する各ユニットの頻度を算出し、算出した頻度が設定された閾値以上となるユニットを高頻度ユニットとして特定する、高頻度ユニット特定部31と、分析対象テキスト11を構成する各ユニットのうち、トピックの変化が発生しているユニットを、トピック変化ユニットとして特定する、トピック変化ユニット特定部35と、高頻度ユニットのうち、トピック変化ユニットに該当するユニットを除き、残った高頻度ユニットの中から、弊害となる語又は語集合を含む弊害ユニットを特定する、弊害ユニット特定部36とを備えている。【選択図】図1
請求項(抜粋):
分析対象テキストからトピック境界の判定に弊害となる語又は語集合を特定するための情報分析装置であって、
前記分析対象テキストと共通のトピックを含む補助テキストを用いて、前記分析対象テキストを構成する各ユニットの頻度を算出し、算出した前記頻度が設定された閾値以上となるユニットを高頻度ユニットとして特定する、高頻度ユニット特定部と、
前記分析対象テキストを構成する各ユニットのうち、トピックの変化が発生しているユニットを、トピック変化ユニットとして特定する、トピック変化ユニット特定部と、
前記高頻度ユニットのうち、前記トピック変化ユニットに該当するユニットを除き、残った高頻度ユニットの中から、前記弊害となる語又は語集合を含む弊害ユニットを特定する、弊害ユニット特定部と、
を備えていることを特徴とする情報分析装置。
IPC (4件):
G10L 15/22
, G06F 17/28
, G06F 17/30
, G06F 19/00
FI (5件):
G10L15/22 300U
, G06F17/28 Z
, G06F17/30 220Z
, G06F17/30 170A
, G06F19/00 130
Fターム (6件):
5B075ND03
, 5B075NK31
, 5B075NS10
, 5B091AA15
, 5B091CA14
, 5D015HH23
前のページに戻る