特許
J-GLOBAL ID:200903032069990783
音声認識システム、音声認識方法および音声認識用プログラム
発明者:
出願人/特許権者:
代理人 (4件):
宮崎 昭夫
, 岩田 慎一
, 緒方 雅昭
, 石橋 政幸
公報種別:公開公報
出願番号(国際出願番号):特願2004-029143
公開番号(公開出願番号):特開2005-221727
出願日: 2004年02月05日
公開日(公表日): 2005年08月18日
要約:
【課題】音声認識システムにおいて、少ない処理量で入力音声の音響モデルを判別、選択しながら、当該入力音声の音声認識を行うことを可能にする。【解決手段】本発明の音声認識システムは、入力音声の先頭の所定区間においては、複数の音響モデルを全て用いて音響尤度計算処理および仮説処理をそれぞれ音響尤度計算部104と仮説処理部106で行う。なお、先頭の所定区間の音響尤度計算処理が終了した時点で音響尤度の計算結果が良い音響モデルがモデル判別部108で選択されている。それ以降の区間においては、モデル判別部108で選択された音響モデルのみを用いて音響尤度計算処理および仮説処理をそれぞれ音響尤度計算部104と仮説処理部106で行う。【選択図】図1
請求項(抜粋):
複数の音響モデルの中から入力音声の音響モデルを判別、選択しながら、当該入力音声の音声認識を行う音声認識システムにおいて、
前記入力音声の特徴量に対し、前記複数の音響モデルとの音響尤度を計算する音響尤度計算手段と、
前記音響尤度計算手段にて前記入力音声の先頭の所定区間分の音響尤度計算が終了した時点で、当該所定区間内に前記音響尤度計算手段にて計算された音響尤度に基づいて、前記入力音声の音響モデルの判別、選択を行うモデル判別手段と、
前記音響尤度計算手段にて前記入力音声の所定区間分の音響尤度計算が終了する度に、当該所定区間内に前記モデル判別手段にて選択された音響モデルに対して計算された音響尤度を用いて仮説処理を行い、前記入力音声の全区間の仮説処理が終了した後に、仮説処理結果に基づく音声認識結果を出力する仮説処理手段とを有し、
前記音響尤度計算手段は、前記入力音声の先頭の所定区間では、前記入力音声の特徴量に対し、前記複数の音響モデルの全てとの音響尤度を各々計算し、前記入力音声の先頭以降の所定区間では、前記入力音声の特徴量に対し、前記モデル判別手段にて選択された音響モデルのみとの音響尤度を計算することを特徴とする音声認識システム。
IPC (3件):
G10L15/06
, G10L15/10
, G10L17/00
FI (5件):
G10L3/00 521V
, G10L3/00 521S
, G10L3/00 521T
, G10L3/00 545A
, G10L3/00 531N
Fターム (6件):
5D015AA02
, 5D015BB02
, 5D015CC17
, 5D015GG01
, 5D015HH04
, 5D015JJ07
引用特許:
出願人引用 (1件)
審査官引用 (9件)
-
特開昭61-048897
-
音声認識装置
公報種別:公開公報
出願番号:特願2001-291825
出願人:日本放送協会
-
特開昭61-048897
全件表示
前のページに戻る