特許
J-GLOBAL ID:200903075143876905

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 曾我 道照 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-180179
公開番号(公開出願番号):特開2002-372985
出願日: 2001年06月14日
公開日(公表日): 2002年12月26日
要約:
【要約】【課題】 回線接続情報を取れない回線や、使用端末による音響特性の変化に対しては、回線特性を判断できないという課題があった。【解決手段】 音声情報を入力し、音響ベクトル列を生成する音響分析部102と、音声モデルを格納する複数の音声モデル格納部106〜108と、前記音響分析部から出力された音響ベクトル列と、対応する音声モデル格納部に格納されている音声モデルを用いて、回線の尤度を求める複数の回線尤度算出部103〜105と、前記複数の回線尤度算出部で出力された尤度から尤度が一番高い回線を、現在接続されている回線と推定する音声モデル選択部109と、前記複数の音声モデル格納部の中から所定の音声モデル格納部を選択接続する音声モデル選択スイッチング部110と、前記音響ベクトル列と前記所定の音声モデル格納部に格納されている音声モデルを比較し音声認識を行い、その結果を出力する音声照合部111とを備えた。
請求項(抜粋):
音声情報を入力し、音響分析結果として音響ベクトル列を生成する音響分析部と、各々音声モデルを格納する複数の音声モデル格納部と、前記音響分析部から出力された音響ベクトル列に対して、対応する音声モデル格納部に格納されている音声モデルを用いて、各々回線の尤度を求める複数の回線尤度算出部と、前記複数の回線尤度算出部で出力された尤度から尤度が一番高い回線を、現在接続されている回線と推定する音声モデル選択部と、前記音声モデル選択部からの制御信号に基づき前記複数の音声モデル格納部の中から所定の音声モデル格納部を選択接続する音声モデル選択スイッチング部と、前記音響分析部から出力された音響ベクトル列と前記音声モデル選択スイッチング部で接続された前記所定の音声モデル格納部に格納されている音声モデルとを比較して音声認識を行い、音声認識結果を出力する音声照合部とを備えたことを特徴とする音声認識装置。
IPC (2件):
G10L 15/06 ,  G10L 15/00
FI (3件):
G10L 3/00 521 V ,  G10L 3/00 521 T ,  G10L 3/00 551 A
Fターム (3件):
5D015HH06 ,  5D015HH13 ,  5D015KK02
引用特許:
審査官引用 (11件)
全件表示

前のページに戻る