特許
J-GLOBAL ID:200903035154460830

未知語登録装置および方法並びに記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 下出 隆史 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-256034
公開番号(公開出願番号):特開平11-085761
出願日: 1997年09月03日
公開日(公表日): 1999年03月30日
要約:
【要約】【課題】 辞書データへの未知語自動登録装置では、仮名、漢字、英字等が混じって入力された日本語の文章からの未知語の抽出、および該未知語の品詞の推定をすることができなかった。【解決手段】 コンピュータにより、入力された日本語文字列を辞書を参照しつつ形態素解析して文節に分かち書きし、該結果に基づいて前記辞書に存在しない未知語を、前記日本語文字列から抽出する。また、該未知語に前接または後接する語である連接語を、前記入力された日本語文字列から少なくとも一つ抽出する。次に、未知語に含まれる文字構成に基づいて品詞を判定する。また、連接語の構成、又は連接語の言語的属性(品詞および接頭語・接尾語の意味等)によっても該未知語の品詞を判定する。さらに未知語の全ての読みを推定した上で、判定された品詞および全ての読みを含めて未知語に関するデータを辞書に追加登録する。
請求項(抜粋):
品詞データを含む辞書を備え、日本語文字列を入力する日本語入力装置において参照される前記辞書に存在しない未知語を、該辞書に自動登録する未知語登録装置であって、入力された日本語文字列を、前記辞書を参照して文節に分かち書きする手段と、該分かち書き結果に基づいて、前記辞書に存在しない未知語を、前記入力された日本語文字列から抽出する未知語抽出手段と、該未知語に前接または後接する語である連接語を、前記入力された日本語文字列から少なくとも一つ抽出する連接語抽出手段と、該連接語の構成、または前記辞書に記憶されている前記連接語の言語上の属性を示すデータに基づいて該未知語の品詞を判定する品詞判定手段と、前記判定された品詞を含めて前記未知語に関するデータを前記辞書に追加登録する追加登録手段とを備える未知語登録装置。
IPC (4件):
G06F 17/28 ,  G06F 17/22 ,  G06F 17/27 ,  G06F 17/30
FI (6件):
G06F 15/38 C ,  G06F 15/20 514 E ,  G06F 15/20 522 L ,  G06F 15/38 E ,  G06F 15/40 370 J ,  G06F 15/401 340 A
引用特許:
審査官引用 (10件)
  • 形態素解析装置および文節辞書作成装置
    公報種別:公開公報   出願番号:特願平3-228056   出願人:三菱電機株式会社
  • かな漢字変換方法
    公報種別:公開公報   出願番号:特願平6-093022   出願人:沖電気工業株式会社
  • 機械翻訳装置
    公報種別:公開公報   出願番号:特願平4-266291   出願人:ブラザー工業株式会社
全件表示

前のページに戻る