特許
J-GLOBAL ID:200903047045087729

未知語読み導出装置および未知語読み導出方法並びに記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 五十嵐 孝雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-007635
公開番号(公開出願番号):特開2000-207394
出願日: 1999年01月14日
公開日(公表日): 2000年07月28日
要約:
【要約】【課題】 辞書に登録されていない未知語をその読みと共に辞書に登録する際に、読みに関する不要な情報が登録されてしまうのを抑える。【解決手段】 未知語を抽出する対象となる文書を入力部40から入力し、文書アクセス部68によって、この文書から一文ずつを取り込む。一文ずつ取り込んだ文章は、形態素解析部50で形態素解析し、その結果を基に、未知語抽出部56において未知語の抽出を行なうと共に、この未知語の品詞の推定と読みの導き出しを行なう。未知語の読みの導き出しは、抽出した未知語を形態素解析し、分割した形態素ごとに可能性のある読みを辞書から検索し、形態素ごとに得られた読みを組み合わせることによって行なう。
請求項(抜粋):
品詞データを含む辞書を備え、該辞書に存在しない未知語を該辞書に登録するために、該未知語の読みを導き出す未知語読み導出装置であって、用意された前記未知語を、前記辞書を参照し、前記辞書が備える品詞データに従って、日本語文法に従った所定の単位である形態素に分割する形態素解析手段と、分割して得られた各々の形態素に対して、前記辞書を参照して可能性のある読みを導き出す形態素別読み導出手段と、導き出された各々の読みを組み合わせ、前記未知語の読みを導き出す未知語読み導出手段とを備える未知語読み導出装置。
IPC (2件):
G06F 17/22 ,  G06F 17/27
FI (3件):
G06F 15/20 522 L ,  G06F 15/20 528 F ,  G06F 15/38 E
Fターム (15件):
5B009LA03 ,  5B009MB16 ,  5B009ME21 ,  5B009MF03 ,  5B009MJ04 ,  5B009QA03 ,  5B091AA11 ,  5B091BA02 ,  5B091BA12 ,  5B091CA02 ,  5B091CB09 ,  5B091CC02 ,  5B091CC17 ,  5B091CD17 ,  5B091DA03
引用特許:
審査官引用 (12件)
  • 特開平4-025966
  • 文字処理装置
    公報種別:公開公報   出願番号:特願平6-090177   出願人:キヤノン株式会社
  • 未知語抽出登録装置
    公報種別:公開公報   出願番号:特願平4-168803   出願人:シャープ株式会社
全件表示

前のページに戻る