特許
J-GLOBAL ID:200903006032034946
発話区間検出装置及び発話区間検出プログラム
発明者:
,
出願人/特許権者:
代理人 (1件):
伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2006-056234
公開番号(公開出願番号):特開2007-233148
出願日: 2006年03月02日
公開日(公表日): 2007年09月13日
要約:
【課題】迅速且つ高精度に発話区間を検出する。【解決手段】入力音声から発話区間を検出する発話区間検出装置において、前記入力音声を音響特徴量に変換する音響分析手段と、前記音響分析手段により得られる音響特徴量と、予め設定された音響モデル及び言語モデルからなるサブワード・ネットワークとを用いて、前記入力音声に同期して各サブワードにおける累積尤度を逐次算出する連続音声認識手段と、各サブワードにおける累積尤度から前記入力音声における発話始端と発話終端とを逐次検出する発話区間検出手段とを有することにより、上記課題を解決する。【選択図】図1
請求項(抜粋):
入力音声から発話区間を検出する発話区間検出装置において、
前記入力音声を音響特徴量に変換する音響分析手段と、
前記音響分析手段により得られる音響特徴量と、予め設定された音響モデル及び言語モデルからなるサブワード・ネットワークとを用いて、前記入力音声に同期して各サブワードにおける累積尤度を逐次算出する連続音声認識手段と、
各サブワードにおける累積尤度から前記入力音声における発話始端と発話終端とを逐次検出する発話区間検出手段とを有することを特徴とする発話区間検出装置。
IPC (4件):
G10L 15/04
, G10L 15/10
, G10L 15/18
, G10L 11/02
FI (4件):
G10L15/04 300Z
, G10L15/10 400M
, G10L15/18 300H
, G10L11/02
Fターム (1件):
引用特許:
出願人引用 (3件)
審査官引用 (9件)
-
音声認識方法及び装置
公報種別:公開公報
出願番号:特願平7-024521
出願人:富士ゼロックス株式会社
-
音声区間検出方法
公報種別:公開公報
出願番号:特願平9-060236
出願人:日本電信電話株式会社
-
音声認識装置
公報種別:公開公報
出願番号:特願2002-057793
出願人:三菱電機株式会社
全件表示
引用文献:
前のページに戻る