特許
J-GLOBAL ID:200903092244436452

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 宮田 金雄 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-251373
公開番号(公開出願番号):特開平10-097285
出願日: 1996年09月24日
公開日(公表日): 1998年04月14日
要約:
【要約】【課題】 音声認識装置において、大語彙の音声が入力される場合でも高い精度で音声を認識する。【解決手段】 頻度付単語辞書記憶部7の使用頻度を表す情報から使用頻度の高いものほど小さな値となる使用頻度スコアを計算し、単語辞書記憶部10に記憶する使用頻度スコア計算部11を備え、照合部3において入力された音声信号S1と単語辞書S12が音響的にどの程度近いかを示す音響スコアに単語辞書記憶部に10に記憶されているその単語の使用頻度スコアを規定の割合で加算して距離値S5とする。かくして、使用頻度が高い単語ほど小さな値となる使用頻度スコアを与え、パターン照合時にこれを加えることにより、使用頻度の高い単語の認識率できる。
請求項(抜粋):
入力される音声信号を一定時間毎に音響分析し、特徴パラメータベクトルと音声信号のパワーとに順次変換し出力する音響分析部と、当該音響分析部から受け取る上記音声信号のパワーの変化により上記音声信号の音声区間を検出し、当該音声区間の検出状況の変化により音声区間検出信号を出力する音声区間検出部と、上記音声区間検出信号の指示に従い上記音響分析部から出力される上記特徴パラメータベクトルの時系列のうち上記音声区間の部分と単語辞書記憶部に記憶されている単語辞書との照合を行い、入力された上記音声信号と上記単語辞書とのパターン照合を行い、距離値として出力する照合部と、上記音声区間検出信号により指示された時、既に受け取った上記距離値をソーティングして上記距離値の小さな1つ又は複数の単語を認識結果として出力する結果出力部とを有する音声認識装置において、認識対象単語の標準パターンと単語の使用頻度を表す情報を収める頻度付単語辞書記憶部と、当該頻度付単語辞書記憶部の使用頻度を表す情報から使用頻度の高いものほど小さな値となる使用頻度スコアを計算し、上記単語辞書記憶部に記憶する使用頻度スコア計算部とを備え、上記照合部において入力された上記音声信号と単語辞書が音響的にどの程度近いかを示す音響スコアに上記単語辞書記憶部に記憶されているその単語の上記使用頻度スコアを規定の割合で加算して距離値とすることを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 561 ,  G10L 3/00 531
FI (2件):
G10L 3/00 561 G ,  G10L 3/00 531 E
引用特許:
出願人引用 (4件)
  • 特開平3-177899
  • 音声処理装置
    公報種別:公開公報   出願番号:特願平6-188202   出願人:富士通テン株式会社
  • 特開昭58-195900
全件表示
審査官引用 (4件)
  • 特開平3-177899
  • 音声処理装置
    公報種別:公開公報   出願番号:特願平6-188202   出願人:富士通テン株式会社
  • 特開昭58-195900
全件表示

前のページに戻る