特許
J-GLOBAL ID:201103072860804578

形態素解析方法および形態素解析プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 伊藤 克博 (外1名)
公報種別:特許公報
出願番号(国際出願番号):特願2000-082551
公開番号(公開出願番号):特開2001-265763
特許番号:特許第3379643号
出願日: 2000年03月23日
公開日(公表日): 2001年09月28日
請求項(抜粋):
【請求項1】 データ処理装置により日本語テキストを単語分割し、単語情報を付与する形態素解析方法であって、前記データ処理装置が、入力装置から日本語テキストを入力し、品詞連鎖の生成および優先度を付与するための、記憶装置に格納されている文法規則に記述された接続可能な単語連鎖を、形態素解析で認定する単語とその単語情報を登録した、記憶装置に格納されている単語辞書より抽出し、単語連鎖候補列を作成し、該記憶装置に出力する単語辞書検索ステップと、前記データ処理装置が、単語情報が指定された文字列に対し、指定された単語情報を満たし、指定されなかった単語情報は最も確からしい情報をもつ単語を第一解として認定し、単語情報が与えられた単語を指定に応じて、日本語テキストで前記単語情報を付与する対象文字列と与える単語情報の指定方法を記述した、記憶装置に格納されている設定情報に登録し、日本語単語情報列を出力装置へ出力する単語選択ステップを有し、前記単語選択ステップは、前記データ処理装置が、前記単語連鎖候補列に対して優先順位を付け、優先順位が最も高い連鎖を第一解とする第1のステップと、前記データ処理装置が、前記日本語テキストに、前記単語情報が与えられた文字列、あるいは前記設定情報の登録単語情報に登録されている単語である対象文字列が存在するかどうか判定する第2のステップと、前記データ処理装置が、対象文字列が存在する場合、該対象文字列と完全一致する単語が、前記優先順位が一位の品詞連鎖に存在するかどうか判定する第3のステップと、前記データ処理装置が、前記対象文字列と完全一致する単語が存在しなければ、前記対象文字列と単語境界が一致し、品詞指定がある場合には品詞も一致する単語が前記単語連鎖候補列の中に存在するかどうか判定する第4のステップと、前記データ処理装置が、前記対象文字列と単語境界が一致する単語が存在すれば、対象文字列に対して、品詞が指定されている場合、その品詞と一致し、他に指定された単語情報も満たす単語が存在すれば、その単語を選択し、他に指定された単語情報が異なる場合には、その単語を単語連鎖を含めて複製し、他に指定されている単語情報を上書きし、対象文字列に対して品詞が指定されていない場合には、第4のステップの中で最も優先度の高い単語連鎖の単語を品詞連鎖を含めて複製し、他に指定されている単語情報を上書きする第5のステップと、前記データ処理装置が、対象文字列に対して品詞が指定されている場合には、対象単語列の境界を単語境界としてもつ品詞連鎖のうち、その境界で指定された品詞と連鎖可能な最も優先度の高い連鎖の前後の品詞連鎖をコピーし、対象単語列は1単語として指定された単語情報を埋め、指定されていない単語情報については、元とした品詞連鎖の単語から、複数ある場合にはその中で単語の優先度の最も高いものから生成し、連鎖可能なものが存在しない場合には未知語との連鎖を生成し、品詞が指定されていない場合には、対象単語列の境界を単語境界としてもつ品詞連鎖のうち、最も優先度の高い単語連鎖をコピーし、対象単語列は1単語として指定された単語情報を埋め、指定されていない単語情報については元の単語の情報から生成する第6のステップと、前記データ処置装置が、第3、第5、第6のステップで扱った単語の優先順位を上げ、それを第一位で選択するようにする第7のステップを含む形態素解析方法。
IPC (1件):
G06F 17/27
FI (1件):
G06F 17/27 E
引用特許:
審査官引用 (2件)
  • 特開平2-033664
  • 特開平2-033664

前のページに戻る