特許
J-GLOBAL ID:201103071637925227

音声認識装置、並びにこれらの方法、これらのプログラムを記録したコンピュータ読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (5件): 曾我 道照 ,  曾我 道治 ,  池谷 豊 ,  古川 秀利 ,  鈴木 憲七
公報種別:特許公報
出願番号(国際出願番号):特願2001-074023
公開番号(公開出願番号):特開2002-278584
特許番号:特許第3894419号
出願日: 2001年03月15日
公開日(公表日): 2002年09月27日
請求項(抜粋):
【請求項1】 認識対象音声を入力して音声認識を行い音声認識結果を出力する音声認識装置であって、 上記認識対象音声を入力し音声特徴量を抽出する音声特徴量抽出手段と、 上記音声特徴量の系列の確率を求めるための音響モデルと、 冗長語を含む学習用テキストを入力して、冗長語も含めて単語列の生起確率を求める言語モデルを生成する冗長語を含む言語モデル生成手段と、 上記冗長語を含む学習用テキストから冗長語を取り除き、冗長語を除いた学習用テキストを生成する冗長語除去手段と、 上記冗長語を除いた学習用テキストを入力し、冗長語を除いた単語列の生起確率を求める言語モデルを生成する冗長語を除いた言語モデル生成手段と、 上記音響モデルと上記冗長語を含む言語モデルとを用いて、上記音声特徴量抽出手段が抽出した音声特徴量に対して照合を行い複数の音声認識結果候補を出力する第1の照合手段と、 この第1の照合手段が出力した複数の音声認識結果候補に対して、上記冗長語を含む言語モデルと上記冗長語を除いた言語モデルとを用いて、照合を行い音声認識結果を出力する第2の照合手段と、 を備えたことを特徴とする音声認識装置。
IPC (3件):
G10L 15/20 ( 200 6.01) ,  G10L 15/18 ( 200 6.01) ,  G10L 15/28 ( 200 6.01)
FI (3件):
G10L 15/20 200 Q ,  G10L 15/18 200 D ,  G10L 15/28 370 Z
引用特許:
審査官引用 (4件)
全件表示
引用文献:
前のページに戻る