特許
J-GLOBAL ID:200903003598429728

未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 小笠原 吉義 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-149272
公開番号(公開出願番号):特開平11-338863
出願日: 1998年05月29日
公開日(公表日): 1999年12月10日
要約:
【要約】【課題】 本発明は、自動的に未知の名詞やカタカナ語を収集し、新しい未知の名詞やカタカナ語を自動的に辞書に登録できるようにすることを目的としている。【解決手段】 文字列を入力し、入力された文字列を単語単位に分割し、単語単位に分割・形態素解析された文字列を蓄積し、蓄積された文字列のうち、解析できない文字列または、解析できない文字列とその周辺の単語を組み合わせた語のうち、所定回数以上繰り返し用いられる名詞を自動的に判定抽出する。
請求項(抜粋):
文字列を入力する情報入力部と、該情報入力部に入力された文字列を単語単位に分割する入力情報形態素解析部と、該入力情報形態素解析部により単語単位に分割・形態素解析された文字列を蓄積する形態素情報蓄積部と、該形態素情報蓄積部に蓄積された文字列のうち、解析できない文字列または、解析できない文字列とその周辺の単語を組み合わせた語のうち、所定回数以上繰り返し用いられる名詞を自動的に判定抽出する名詞自動抽出部と、をもつことを特徴とする未知名詞および表記ゆれカタカナ語自動収集・認定装置。
IPC (3件):
G06F 17/28 ,  G06F 17/22 ,  G06F 17/27
FI (4件):
G06F 15/38 C ,  G06F 15/20 512 P ,  G06F 15/20 522 L ,  G06F 15/38 E

前のページに戻る