Pat
J-GLOBAL ID:201103094725489380

テキスト解析装置及び方法

Inventor:
Applicant, Patent owner:
Agent (1): 特許業務法人ウィルフォート国際特許事務所
Gazette classification:公開公報
Application number (International application number):2009148037
Publication number (International publication number):2011003157
Application date: Jun. 22, 2009
Publication date: Jan. 06, 2011
Summary:
【課題】ブログなどのテキストにおいて、そこで記述されている内容を特徴付ける文字列を迅速に抽出する。【解決手段】テキストが含まれているファイルを記憶するブログデータ記憶部15と、ファイル内のテキストから抽出された文字列を記憶する抽出文字列記憶部19と、ブログデータ記憶部15に記憶されているファイル内のテキストにおいて、少なくとも句読点と、すべてのひらがなまたは所定の除外文字以外のすべてのひらがなとを含む消去文字を空白に置換する置換処理を行う消去文字列処理部173と、消去文字列処理部173によって置換処理が行われた置換処理済みテキストから、空白で挟まれている文字列を抽出し、抽出された文字列を抽出文字列記憶部19に格納する切出し処理部177と、を備える。【選択図】図2
Claim (excerpt):
テキストから文字列を抽出するテキスト解析装置であって、 テキストが含まれているファイルを記憶するテキスト記憶部と、 前記ファイル内のテキストから抽出された文字列を記憶する抽出文字列記憶部と、 前記テキスト記憶部に記憶されているファイル内のテキストにおいて、少なくとも句読点と、すべてのひらがなまたは所定の除外文字以外のすべてのひらがなとを含む消去文字を空白に置換する置換処理を行う置換処理部と、 前記置換処理部によって置換処理が行われた置換処理済みテキストから、空白で挟まれている文字列を抽出し、抽出された文字列を前記抽出文字列記憶部に格納する文字列抽出部と、を備えるテキスト解析装置。
IPC (4):
G06F 19/00 ,  G06F 17/30 ,  G06F 17/21 ,  G06Q 10/00
FI (6):
G06F19/00 130 ,  G06F17/30 220Z ,  G06F17/21 550A ,  G06F17/30 170A ,  G06F17/30 210A ,  G06F17/60 170Z
F-Term (4):
5B075ND03 ,  5B075NK39 ,  5B075NS10 ,  5B109QA03

Return to Previous Page