特許
J-GLOBAL ID:201103007345021092

中国語テキストにおける単語分割

発明者:
出願人/特許権者:
代理人 (3件): 合田 潔 ,  谷 義一 ,  阿部 和夫
公報種別:特許公報
出願番号(国際出願番号):特願2000-551333
特許番号:特許第4459443号
出願日: 1999年05月28日
請求項(抜粋):
【請求項1】 コンピュータシステムにおいて中国語テキストセンテンス中に現れる個々の単語を識別するための単語識別方法であって、前記コンピュータシステムは、プログラムを記憶したメモリを有し、前記コンピュータシステムのCPUが前記メモリに記憶されたプログラムに基づいて実行する単語識別方法であって、 複数の文字の各々について、 前記CPUが、前記文字で開始される単語の第2番目の位置に現れる文字の組の第1の指示を格納するステップと、 前記CPUが、単語の中で前記文字が現れる位置の組の第2の指示を格納するステップと、 前記センテンス中に現れる複数の連続した文字グループの各々について、 前記CPUが、前記第1の指示から前記グループの第2番目の位置に現れた文字が、前記グループの第1番目の位置に現れた前記文字で開始される単語中に現れることを指示されているかどうかを判定するステップと、 前記CPUが、もし、前記グループの第2番目の位置に現れた文字が、前記グループの第1番目の位置に現れた前記文字で開始される単語中に現れることを指示されていると判定された場合、前記第2の指示から前記グループの各々の文字が、前記グループ中に現れる位置において前記単語中に現れることを指示されているかどうかを判定するステップと、 前記CPUが、もし、前記グループの各々の文字が、前記グループ中に現れる位置において前記単語中に現れることを指示されていると判定された場合、文字の前記グループが中国語に使用されている単語であるかどうかを判定するために、文字の前記グループを中国語に使用されている単語のリストと比較するステップと、 前記CPUが、中国語に使用されている単語であると判定された文字の前記グループを構文解析パーサに提供するステップと、 前記CPUが、前記構文解析パーサから前記センテンスの構文構造を識別するパース構造を受け取るステップと、前記パース構造は提供された文字の前記グループのサブセットを前記センテンスの構文構造の一部として指定するものであり、 前記CPUが、前記パース構造により指定された文字の前記グループを、前記センテンス中に現れる単語として識別するステップと、 を含むことを特徴とする単語識別方法。
IPC (2件):
G06F 17/27 ( 200 6.01) ,  G06F 17/21 ( 200 6.01)
FI (2件):
G06F 17/27 E ,  G06F 17/21 592 J

前のページに戻る