特許
J-GLOBAL ID:200903030140902472

文字組抽出方法、文字組抽出装置および文字組抽出のための記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 須田 篤
公報種別:公開公報
出願番号(国際出願番号):特願平11-189651
公開番号(公開出願番号):特開2001-022752
出願日: 1999年07月02日
公開日(公表日): 2001年01月26日
要約:
【要約】【課題】従来の形態素解析のように単語辞書や文法のルールを必要とせず、文字の接続確率などの学習も必要とせず、文書のみから単語・文節を抽出できるようにする。【解決手段】処理対象の入力文書から一文ずつ抽出し、その一文の先頭から始まる文字組と、それまでの入力文を蓄えている蓄積文書中の文字組となるべく長く一致する文字組を抽出し、文字組データベースに登録する。その際、抽出された文字組としては登録されておらず、より短い文字組として登録されている文字組がある場合にはその頻度カウンタによるカウントを減らしておく。入力文書は上記の処理の後、一文字ずつ蓄積文書記憶装置に登録され、入力文書がなくなると次の一文を入力する。
請求項(抜粋):
文字列を入力するステップと、入力した文字列を蓄積するステップと、蓄積した文字列からそれぞれ一致する文字組のうち最も長い文字数の文字組を抽出するステップと、抽出した文字組を記憶するステップとを、有することを特徴とする文字組抽出方法。
IPC (2件):
G06F 17/27 ,  G06F 17/30
FI (3件):
G06F 15/38 E ,  G06F 15/40 370 A ,  G06F 15/401 330 Z
Fターム (8件):
5B075ND03 ,  5B075NK32 ,  5B075PP24 ,  5B075UU06 ,  5B091AA15 ,  5B091CA02 ,  5B091CA03 ,  5B091EA24

前のページに戻る