Pat
J-GLOBAL ID:200903034892456094
言語モデル作成装置および言語モデル作成プログラムを記録した記録媒体
Inventor:
,
Applicant, Patent owner:
Agent (1):
谷 義一 (外2名)
Gazette classification:公開公報
Application number (International application number):2000280301
Publication number (International publication number):2002091967
Application date: Sep. 14, 2000
Publication date: Mar. 29, 2002
Summary:
【要約】【課題】 書きことばで書かれた原稿から話しことばや解説口調特有の言い回しを表わす単語列を自動生成し、話しことばや解説口調を精度よく認識する。【解決手段】 (i)過去の全記者原稿によりN-gram言語モデル1を作成する。(ii)最新の記者原稿2に対して形態素解析を行い(工程3)、出現するN個組単語の頻度情報を生成する(工程4)。(iii) (ii)の形態素解析結果に変換規則テーブル5の変換規則を適用して、話しことばや解説口調特有の言い回しを表す単語列を自動生成する(工程6)。この生成単語列に出現するN個組単語の頻度情報を生成する(工程7)。(iv)(ii)で作成したN個組単語の頻度情報と、(iii)で作成したN個組単語の頻度情報をマージしたものを基に、N-gram言語モデルを作成する(工程8)。(v)(i)で作成した言語モデル1に対し、(iv)で作成した言語モデルにより適応化した言語モデルを作成する(工程9)。
Claim (excerpt):
書きことばで書かれた原稿に対して書きことばを話しことばに変換するための変換規則を適用して話しことばの言語モデルを自動生成する手段を有することを特徴とする言語モデル作成装置。
IPC (3):
G06F 17/28
, G06F 17/27
, G10L 15/18
FI (4):
G06F 17/28 P
, G06F 17/28 R
, G06F 17/27 E
, G10L 3/00 537 D
F-Term (5):
5B091AA13
, 5B091BA03
, 5B091CA02
, 5B091CA24
, 5D015HH00
Return to Previous Page