特許
J-GLOBAL ID:200903056816457166
形態素解析処理方法
発明者:
出願人/特許権者:
代理人 (1件):
磯村 雅俊
公報種別:公開公報
出願番号(国際出願番号):特願平4-172177
公開番号(公開出願番号):特開平6-019960
出願日: 1992年06月30日
公開日(公表日): 1994年01月28日
要約:
【要約】【目的】 辞書への未登録語が存在する場合でも、高精度で未登録語を特定でき、解析結果に複数の形態素分割の候補または複数の品詞の候補が存在する場合でも、高精度で形態素分割と品詞付与ができるような形態素解析処理方法を実現する。【構成】 文字種類の変化情報に基づいて文字列を分割し、分割文字列を決定した後、辞書への未登録語により単語登録テ-ブル中の形態素の接続が分断されるとき、その分断位置を内部に含む分割文字列を決定し、形態素の品詞カテゴリと文字種類と文字数に基づいて分割文字列の範囲内に存在する未登録語を特定する。
請求項(抜粋):
名詞、動詞、形容詞、形容動詞等の自立語が登録された自立語辞書と、助詞、助動詞、活用語尾等が登録された付属語辞書と、形態素の品詞カテゴリおよび文字数に基づいて隣接する形態素間の接続の可否を定める形態素接続辞書とを備え、入力された文字列を上記自立語辞書および付属語辞書を検索して品詞を付与し、検索結果の中から上記形態素接続辞書により接続が許可される形態素を単語登録テ-ブルに登録する形態解析処理方法において、文字種類の変化情報に基づいて文字列を分割し、分割された文字列を決定する第1のステップと、上記自立語辞書および付属語辞書への未登録語により、上記単語登録テ-ブル中の形態素の接続が分断される場合には、分断位置を内部に含む分割文字列を決定する第2のステップと、形態素の品詞カテゴリと文字種類および文字数に基づいて、分割文字列の範囲内に存在する未登録語を特定する第3のステップとを有することを特徴とする形態素解析処理方法。
前のページに戻る