Pat
J-GLOBAL ID:201203092813329118
マイクロブログテキスト分類装置及び方法及びプログラム
Inventor:
,
Applicant, Patent owner:
Agent (2):
伊東 忠彦
, 石原 隆治
Gazette classification:公開公報
Application number (International application number):2010224166
Publication number (International publication number):2012079121
Application date: Oct. 01, 2010
Publication date: Apr. 19, 2012
Summary:
【課題】 利用者が与える任意の指定文字列に関連するか否かをにより入力テキスト(マイクロブログテキスト)を分類する。【解決手段】 本発明は、入力テキストに指定文字列が含まれるか否かを判定し、指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと入力テキストを連結したテキストと、比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを連結テキスト記憶手段に出力し、連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求め、これを基に、入力テキストの、指定文字列への関連スコアを求めスコア出力手段の関連スコアに基づいて、入力テキストを指定文字列に関連するか否かを分類する。【選択図】 図1
Claim (excerpt):
マイクロブログの入力テキストを、利用者が与える任意の指定文字列に関連するか否かを分類する、マイクロブログテキスト分類装置であって、
前記指定文字列が含まれる指定テキストを記憶する指定テキスト記憶手段と、
前記指定テキストを除く比較テキストを記憶する比較テキスト記憶手段と、
連結されたテキストを格納する連結テキスト記憶手段と、
前記入力テキストに、前記指定文字列が含まれるか否かを判定するテキスト解析手段と、
前記指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと前記入力テキストを連結したテキストと、前記比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを前記連結テキスト記憶手段に出力するテキスト連結手段と、
前記連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求めるテキスト圧縮手段と、
前記データ圧縮手段で求められた前記圧縮後のデータサイズを基に、前記入力テキストの、指定文字列への関連スコアを求めるスコア出力手段と、
前記スコア出力手段の関連スコアに基づいて、前記入力テキストを前記指定文字列に関連するか否かを分類するテキスト分類手段と、
を有することを特徴とするマイクロブログテキスト分類装置。
IPC (1):
FI (3):
G06F17/30 210D
, G06F17/30 170A
, G06F17/30 350C
F-Term (7):
5B075ND03
, 5B075NK32
, 5B075NR12
, 5B075NR16
, 5B075PQ74
, 5B075PR06
, 5B075QM08
Return to Previous Page