特許
J-GLOBAL ID:200903040243054971

音声認識におけるノンインタラクティブ方式のエンロ-ルメント

発明者:
出願人/特許権者:
代理人 (1件): 社本 一夫 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-168768
公開番号(公開出願番号):特開2000-035795
出願日: 1999年06月15日
公開日(公表日): 2000年02月02日
要約:
【要約】 (修正有)【課題】音声認識システムのユーザをコンピュータがエンロールする方法である。【解決手段】複数のユーザ・アタランスを含みエンロール用テキストに略々対応しているユーザ音声を表すデータを収集し、あるユーザ・アタランスに対応したデータの音響コンテンツを解析する。コンピュータは、その解析結果に基づいて、そのユーザ・アタランスがエンロール用テキストのいずれかの部分にマッチングしているか否かを判定する。もしマッチングしていたならば、コンピュータは、そのユーザ・アタランスの音響コンテンツを用いて、そのエンロール用テキストの当該部分に対応した音響モデルを更新する。コンピュータは、ユーザがエンロール用テキストの単語を読み飛ばしたり、反復して読み上げたりした場合でも、そのユーザ・アタランスがエンロール用テキストのいずれかの部分にマッチングするか否かを判定することができる。
請求項(抜粋):
音声認識システムのユーザをエンロールするための、コンピュータが実行するエンロールメント方法において、複数のユーザ・アタランスを含みエンロール用テキストに略々対応しているユーザ音声を表すデータを収集するデータ収集処理を実行し、1つのユーザ・アタランスに対応したデータの音響コンテンツを解析する解析処理を実行し、前記解析の結果に基づいて、当該ユーザ・アタランスが前記エンロール用テキストのいずれかの部分とマッチングしているか否かを判定し、当該ユーザ・アタランスが前記エンロール用テキストのいずれかの部分とマッチングしていたならば、当該ユーザ・アタランスの音響コンテンツに基づいて、前記エンロール用テキストの当該部分に対応した音響モデルを更新し、当該ユーザ・アタランスが前記エンロール用テキストのいずれかの部分とマッチングしているか否かを判定する際に、ユーザが前記エンロール用テキストの単語を読み飛ばしても当該ユーザ・アタランスのマッチングの有無を判定し得るようにした、ことを特徴とする方法。
FI (2件):
G10L 3/00 521 C ,  G10L 3/00 521 L
引用特許:
審査官引用 (4件)
  • 特開平2-193199
  • 特開平1-106098
  • 特開昭63-149699
全件表示

前のページに戻る