Pat
J-GLOBAL ID:200903038466156089

テキスト分割方法及び装置及びテキスト分割プログラム及びテキスト分割プログラムを格納した記憶媒体

Inventor:
Applicant, Patent owner:
Agent (1): 伊東 忠彦
Gazette classification:公開公報
Application number (International application number):2001146872
Publication number (International publication number):2002342324
Application date: May. 16, 2001
Publication date: Nov. 29, 2002
Summary:
【要約】【課題】 テキストから正解である意味段落の境界のみを過不足なく認定することを可能とする。【解決手段】 本発明は、テキストを形態素解析して、単語に分割し、単語の意味を表現するベクトルが格納されている概念ベースを検索することによって形態素解析処理で得られた各単語に対応するベクトルを取得し、単語の境界の前後に、ある個数の単語の集合である単語列をとり、各単語列を構成する単語のベクトルの情報から前後の単語列の類似尺度または、距離尺度である単語列結束度を算出し、単語列結束度が類似尺度である場合、極小である単語境界を、距離尺度である場合、極大である単語境界を、テキストの意味段落の境界と認定する。
Claim (excerpt):
テキストを意味的なまとまりの単位である意味段落に分割するテキスト分割方法において、前記テキストを形態素解析して、単語に分割する形態素解析過程と、単語の意味を表現するベクトルが格納されている概念ベースを検索することによって前記形態素解析過程で得られた各単語に対応するベクトルを取得する単語ベクトル取得過程と、単語の境界の前後に、ある個数の単語の集合である単語列をとり、各単語列を構成する単語のベクトルの情報から前後の単語列の類似尺度または、距離尺度である単語列結束度を算出する単語列結束度算出過程と、単語列結束度が類似尺度である場合、極小である単語境界を、距離尺度である場合、極大である単語境界を、前記テキストの意味段落の境界と認定する意味段落境界認定過程とからなることを特徴とするテキスト分割方法。
IPC (2):
G06F 17/27 ,  G06F 17/21 550
FI (2):
G06F 17/27 Z ,  G06F 17/21 550 A
F-Term (7):
5B009QA01 ,  5B009QA04 ,  5B009QA09 ,  5B009VA02 ,  5B091CA02 ,  5B091CA05 ,  5B091CA12

Return to Previous Page