特許
J-GLOBAL ID:200903074093855549
特定話者用単語音声認識装置
発明者:
,
,
出願人/特許権者:
代理人 (1件):
川口 義雄 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-183447
公開番号(公開出願番号):特開平8-044388
出願日: 1994年08月04日
公開日(公表日): 1996年02月16日
要約:
【要約】【目的】 利用者の登録音声とエコーバックやガイダンス音声あるいは認識結果の表示などが食い違うことなしに、類似単語の登録を避け高い認識性能を実現する特定話者用単語音声認識装置を提供する。【構成】 音声入力を促すガイド音声を出力する音声合成部1と、音声を入力するマイクロホン2と、入力音声を分析して特徴量を抽出する単語登録/認識部3と、抽出された特徴量を記憶する単語認識・再生パターンメモリ4と、入力音声の特徴量と、登録単語音声の特徴量との距離を算出する演算手段9と、特徴量間の距離が所定値以上でない単語を報知する報知手段10と、利用者が音声を登録する際に、初期認識語彙として用意されている単語では音声パターン間の距離が十分な大きさを確保できない場合、次候補として用意されている他の単語を登録するように制御する制御手段11とを配設した。
請求項(抜粋):
利用者が複数の対象を表す単語の音声を予め自分の声で登録した後、使用時に登録されている前記単語の何れかを選択して発声したときに、発声された音声パターンとすでに登録されている音声パターンとを比較して発声された単語を認識しその結果を出力することによって前記複数の対象を識別する特定話者用単語音声認識装置であって、利用者が音声を入力する入力手段と、入力された音声を分析して特徴量を抽出する特徴量抽出手段と、抽出された特徴量を記憶する記憶手段と、入力された単語の音声の特徴量と、すでに登録されている単語の音声の特徴量との間の距離を算出する演算手段と、新たに入力された単語と登録されている前記単語と特徴量間の距離が前記複数の対象を識別するために十分な大きさを確保できないと判断した場合、次候補として用意されている他の単語の音声を登録するように制御する制御手段とを具備する特定話者用単語音声認識装置。
IPC (3件):
G10L 3/00 521
, G10L 3/00
, G10L 3/00 571
引用特許:
審査官引用 (38件)
-
特開昭57-129497
-
特開昭57-129497
-
特公平5-074837
-
特公平5-074837
-
特開昭58-076944
-
特公昭61-026677
-
特公平2-015080
-
特開昭60-218698
-
特開平3-123249
-
特公昭61-026677
-
特公平2-015080
-
特開昭63-070296
-
特開昭62-260194
-
特開平3-123249
-
特開平1-285997
-
特開昭63-070296
-
特開昭62-260194
-
特開昭63-038994
-
特開昭56-123600
-
特開平1-285997
-
特開昭63-294600
-
特開昭63-038994
-
特開平3-010298
-
特開昭56-123600
-
特開昭63-294600
-
特開平2-023399
-
特開平3-010298
-
特開昭58-178396
-
特開平2-141154
-
特開平2-023399
-
特開昭58-178396
-
特公平5-038958
-
特公平6-007347
-
特開平2-141154
-
特公平4-062595
-
特公平5-038958
-
特公平6-007347
-
特公平4-062595
全件表示
前のページに戻る