特許
J-GLOBAL ID:200903034892456094

言語モデル作成装置および言語モデル作成プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 谷 義一 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-280301
公開番号(公開出願番号):特開2002-091967
出願日: 2000年09月14日
公開日(公表日): 2002年03月29日
要約:
【要約】【課題】 書きことばで書かれた原稿から話しことばや解説口調特有の言い回しを表わす単語列を自動生成し、話しことばや解説口調を精度よく認識する。【解決手段】 (i)過去の全記者原稿によりN-gram言語モデル1を作成する。(ii)最新の記者原稿2に対して形態素解析を行い(工程3)、出現するN個組単語の頻度情報を生成する(工程4)。(iii) (ii)の形態素解析結果に変換規則テーブル5の変換規則を適用して、話しことばや解説口調特有の言い回しを表す単語列を自動生成する(工程6)。この生成単語列に出現するN個組単語の頻度情報を生成する(工程7)。(iv)(ii)で作成したN個組単語の頻度情報と、(iii)で作成したN個組単語の頻度情報をマージしたものを基に、N-gram言語モデルを作成する(工程8)。(v)(i)で作成した言語モデル1に対し、(iv)で作成した言語モデルにより適応化した言語モデルを作成する(工程9)。
請求項(抜粋):
書きことばで書かれた原稿に対して書きことばを話しことばに変換するための変換規則を適用して話しことばの言語モデルを自動生成する手段を有することを特徴とする言語モデル作成装置。
IPC (3件):
G06F 17/28 ,  G06F 17/27 ,  G10L 15/18
FI (4件):
G06F 17/28 P ,  G06F 17/28 R ,  G06F 17/27 E ,  G10L 3/00 537 D
Fターム (5件):
5B091AA13 ,  5B091BA03 ,  5B091CA02 ,  5B091CA24 ,  5D015HH00

前のページに戻る