特許
J-GLOBAL ID:200903069067933961

文書形態素解析装置

発明者:
出願人/特許権者:
代理人 (1件): 服部 毅巖
公報種別:公開公報
出願番号(国際出願番号):特願平7-164900
公開番号(公開出願番号):特開平9-016594
出願日: 1995年06月30日
公開日(公表日): 1997年01月17日
要約:
【要約】【目的】 入力した文書を形態素単位に区切り、それぞれの単位の持つ性質を明らかにして出力する文書形態素解析装置に関し、文書記述言語が付加され、かつ一文の区切りが認識された形態素解析結果を自然言語処理装置に出力することを第1の目的とする。【構成】 入力手段3に、文書記述言語による記述が施された文書が入力され、解析手段4へ送られる。解析手段4は、制御情報辞書2に含まれる文末記号2aから、入力文書内の一文の区切りを認識する。また、解析手段4は、制御情報辞書2に含まれる文書記述言語2bを参照して、入力文書から文書記述言語を除いた文書を抽出し、単語辞書1を参照して、その抽出された文書に対して従来の形態素解析を行う。出力手段5は、入力手段3に入力された文書に含まれていた文書記述言語による記述とともに、解析手段4の解析結果を自然言語処理装置等に出力する。
請求項(抜粋):
入力した文書を形態素単位に区切り、それぞれの単位の持つ性質を明らかにして出力する文書形態素解析装置において、形態素解析に使用する単語辞書と、一文の区切りを認識するための属性が付加された文末記号と文書記述言語とから構成された制御情報辞書と、文書記述言語による記述を含んだ文書が入力される入力手段と、前記入力手段に入力された文書を基に、前記単語辞書および前記制御情報辞書を参照して、一文の区切りを認識するとともに、文書記述言語を除いた文書を抽出し、その抽出された文書に対して形態素解析を行う解析手段と、前記解析手段の解析結果を、前記入力手段に入力された文書に含まれた文書記述言語による記述とともに出力する出力手段と、を有することを特徴とする文書形態素解析装置。
FI (3件):
G06F 15/38 E ,  G06F 15/20 550 A ,  G06F 15/20 550 E
引用特許:
審査官引用 (1件)
  • 機械翻訳の方法
    公報種別:公開公報   出願番号:特願平6-206187   出願人:神戸日本電気ソフトウェア株式会社

前のページに戻る