特許
J-GLOBAL ID:201203012501592373

対話音声認識システム、対話音声認識方法および対話音声認識用プログラム

発明者:
出願人/特許権者:
代理人 (1件): 家入 健
公報種別:再公表公報
出願番号(国際出願番号):JP2009002062
公開番号(公開出願番号):WO2010-013371
出願日: 2009年05月12日
公開日(公表日): 2010年02月04日
要約:
人間同士の対話音声を音声認識する際に、対話の普遍的な構造を制約として利用することで、適用範囲をより広げることができる対話音声認識システムを提供することを目的とする。音響尤度算出手段701は、ある音素列から入力された音声信号が生起する尤度を与える。言語尤度算出手段702は、ある単語列が生起する尤度を与える。最尤候補探索手段703は、音響尤度算出手段および言語尤度算出手段が与える尤度を用いて音声信号から生起する尤度が最大になる単語列を与える。また、言語尤度算出手段702は、音声認識手段に入力された音声信号を発した話者が発話権を有する場合と有さない場合とで異なる言語尤度を与える。
請求項(抜粋):
複数の話者による対話での各話者の音声信号と、音声信号を発した話者が発話権を有しているか否か、あるいは、話者が発話権を有する確かさを示す発話権情報とが入力され、音声信号に対する音声認識を行う音声認識手段を備え、 前記音声認識手段は、 ある音素列から入力された音声信号が生起する尤度を与える音響尤度算出手段と、 ある単語列が生起する尤度を与える言語尤度算出手段と、 前記音響尤度算出手段および前記言語尤度算出手段が与える尤度を用いて音声信号から生起する尤度が最大になる単語列を与える最尤候補探索手段とを少なくとも備え、 前記言語尤度算出手段は、 前記音声認識手段に入力された音声信号を発した話者が発話権を有する場合と有さない場合とで異なる言語尤度を与える ことを特徴とする対話音声認識システム。
IPC (5件):
G10L 15/18 ,  G10L 15/22 ,  G10L 15/06 ,  G10L 15/10 ,  G10L 15/04
FI (5件):
G10L15/18 400 ,  G10L15/22 300Z ,  G10L15/06 400V ,  G10L15/10 300Z ,  G10L15/04 200
Fターム (1件):
5D015LL10

前のページに戻る