特許
J-GLOBAL ID:201203092813329118
マイクロブログテキスト分類装置及び方法及びプログラム
発明者:
,
出願人/特許権者:
代理人 (2件):
伊東 忠彦
, 石原 隆治
公報種別:公開公報
出願番号(国際出願番号):特願2010-224166
公開番号(公開出願番号):特開2012-079121
出願日: 2010年10月01日
公開日(公表日): 2012年04月19日
要約:
【課題】 利用者が与える任意の指定文字列に関連するか否かをにより入力テキスト(マイクロブログテキスト)を分類する。【解決手段】 本発明は、入力テキストに指定文字列が含まれるか否かを判定し、指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと入力テキストを連結したテキストと、比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを連結テキスト記憶手段に出力し、連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求め、これを基に、入力テキストの、指定文字列への関連スコアを求めスコア出力手段の関連スコアに基づいて、入力テキストを指定文字列に関連するか否かを分類する。【選択図】 図1
請求項(抜粋):
マイクロブログの入力テキストを、利用者が与える任意の指定文字列に関連するか否かを分類する、マイクロブログテキスト分類装置であって、
前記指定文字列が含まれる指定テキストを記憶する指定テキスト記憶手段と、
前記指定テキストを除く比較テキストを記憶する比較テキスト記憶手段と、
連結されたテキストを格納する連結テキスト記憶手段と、
前記入力テキストに、前記指定文字列が含まれるか否かを判定するテキスト解析手段と、
前記指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと前記入力テキストを連結したテキストと、前記比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを前記連結テキスト記憶手段に出力するテキスト連結手段と、
前記連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求めるテキスト圧縮手段と、
前記データ圧縮手段で求められた前記圧縮後のデータサイズを基に、前記入力テキストの、指定文字列への関連スコアを求めるスコア出力手段と、
前記スコア出力手段の関連スコアに基づいて、前記入力テキストを前記指定文字列に関連するか否かを分類するテキスト分類手段と、
を有することを特徴とするマイクロブログテキスト分類装置。
IPC (1件):
FI (3件):
G06F17/30 210D
, G06F17/30 170A
, G06F17/30 350C
Fターム (7件):
5B075ND03
, 5B075NK32
, 5B075NR12
, 5B075NR16
, 5B075PQ74
, 5B075PR06
, 5B075QM08
前のページに戻る