Pat
J-GLOBAL ID:200903047045087729

未知語読み導出装置および未知語読み導出方法並びに記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 五十嵐 孝雄 (外2名)
Gazette classification:公開公報
Application number (International application number):1999007635
Publication number (International publication number):2000207394
Application date: Jan. 14, 1999
Publication date: Jul. 28, 2000
Summary:
【要約】【課題】 辞書に登録されていない未知語をその読みと共に辞書に登録する際に、読みに関する不要な情報が登録されてしまうのを抑える。【解決手段】 未知語を抽出する対象となる文書を入力部40から入力し、文書アクセス部68によって、この文書から一文ずつを取り込む。一文ずつ取り込んだ文章は、形態素解析部50で形態素解析し、その結果を基に、未知語抽出部56において未知語の抽出を行なうと共に、この未知語の品詞の推定と読みの導き出しを行なう。未知語の読みの導き出しは、抽出した未知語を形態素解析し、分割した形態素ごとに可能性のある読みを辞書から検索し、形態素ごとに得られた読みを組み合わせることによって行なう。
Claim (excerpt):
品詞データを含む辞書を備え、該辞書に存在しない未知語を該辞書に登録するために、該未知語の読みを導き出す未知語読み導出装置であって、用意された前記未知語を、前記辞書を参照し、前記辞書が備える品詞データに従って、日本語文法に従った所定の単位である形態素に分割する形態素解析手段と、分割して得られた各々の形態素に対して、前記辞書を参照して可能性のある読みを導き出す形態素別読み導出手段と、導き出された各々の読みを組み合わせ、前記未知語の読みを導き出す未知語読み導出手段とを備える未知語読み導出装置。
IPC (2):
G06F 17/22 ,  G06F 17/27
FI (3):
G06F 15/20 522 L ,  G06F 15/20 528 F ,  G06F 15/38 E
F-Term (15):
5B009LA03 ,  5B009MB16 ,  5B009ME21 ,  5B009MF03 ,  5B009MJ04 ,  5B009QA03 ,  5B091AA11 ,  5B091BA02 ,  5B091BA12 ,  5B091CA02 ,  5B091CB09 ,  5B091CC02 ,  5B091CC17 ,  5B091CD17 ,  5B091DA03
Patent cited by the Patent:
Cited by examiner (7)
  • 特開平4-025966
  • 文字処理装置
    Gazette classification:公開公報   Application number:特願平6-090177   Applicant:キヤノン株式会社
  • 未知語抽出登録装置
    Gazette classification:公開公報   Application number:特願平4-168803   Applicant:シャープ株式会社
Show all

Return to Previous Page