特許
J-GLOBAL ID:200903089317980546

音声処理装置および方法、記録媒体並びにプログラム

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2002-337892
公開番号(公開出願番号):特開2004-170765
出願日: 2002年11月21日
公開日(公表日): 2004年06月17日
要約:
【課題】削除誤りを少なくし、音声認識率を向上させることができるようにする【解決課題】図16Cに示されるように、単語「は」と単語「<OOV>」の境界に対応する部分において、音節「ハ」を含まないパス91、並びに、音節「ハ」を含むパス92およびパス93が生成され、単語「<OOV>」と単語「です」の境界に対応する部分において、音節「ワ」を含まないパス101、並びに、音節「ワ」を含むパス102およびパス103が生成され、単語と音節とのネットワークが生成される。これにより、入力音声に対して最適なネットワーク上のサブワード系列を選択することができる。本発明は、音声認識装置に適用することができる。【選択図】 図16
請求項(抜粋):
入力音声を処理し、その処理結果に基づいて、前記入力音声に含まれる単語を登録する音声処理装置であって、 連続する前記入力音声を認識する認識手段と、 前記認識手段により認識された認識結果に、未知語が含まれているか否かを判定する未知語判定手段と、 前記未知語判定手段において前記認識結果に前記未知語が含まれていると判定された場合、前記未知語の単語境界に対応する時刻のサブワードを含むパスと、そのサブワードを含まないパスを有するネットワークを生成するネットワーク生成手段と、 前記未知語判定手段により、前記未知語が含まれていると判定された場合、前記未知語に対応する単語を獲得する獲得手段と、 前記獲得手段により獲得された前記単語を他の情報に関連付けて登録する登録手段と を備えることを特徴とする音声処理装置。
IPC (2件):
G10L15/06 ,  G10L15/00
FI (2件):
G10L3/00 521C ,  G10L3/00 551B
Fターム (2件):
5D015HH11 ,  5D015HH23
引用特許:
審査官引用 (9件)
全件表示
引用文献:
前のページに戻る