特許
J-GLOBAL ID:200903007051254384

サービスアプリケーションに対するユーザインタフェースの音声制御

発明者:
出願人/特許権者:
代理人 (1件): 浅村 皓 (外3名)
公報種別:公表公報
出願番号(国際出願番号):特願2000-577652
公開番号(公開出願番号):特表2002-528804
出願日: 1999年10月05日
公開日(公表日): 2002年09月03日
要約:
【要約】遠隔サーバから端末へ供給されたサービスアプリケーションの音声制御は、端末と遠隔アプリケーション部分とに分散される。所定のマークアップ言語によって定められた端末機能に関連する、ユーザから供給されたオーディオ入力の部分を認識するための比較的低能力の自動音声認識システム(ASR)が端末に備えられる。認識されたワードは、端末機能を制御するために用いられ、または、テキストに変換されて遠隔サーバへ送られる。オーディオ入力の非認識部分は、コード化され、もっと強力なASRを含む遠隔アプリケーション部分へ送られる。遠隔アプリケーション部分は、そのASRを用いて、アプリケーションによって定められたワードを認識する。認識されたワードは、テキストに変換され、遠隔サーバへ入力として供給される。逆方向では、遠隔アプリケーション部分が遠隔サーバから受取ったテキストは、コード化オーディオ出力信号に変換されて端末へ送られ、端末は次にスピーカへ供給されるべき信号を発生する。このようにして、遠隔サーバの視覚ディスプレイ出力およびキーボード入力の代わりに音声制御機構が用いられる。
請求項(抜粋):
遠隔サーバから端末へ供給されるサービスアプリケーションを制御する方法であって、 オーディオ情報を表すオーディオ入力信号を受取るステップと、 前記端末に配置された第1の自動音声認識システムを用いて、前記オーディオ入力信号が第1の語彙によって定められた1つ以上のワードを含むかどうかを決定するステップであって、前記第1の語彙によって定められた前記1つ以上のワードに対応しない前記オーディオ入力信号の部分が、該オーディオ入力信号の非認識部分を構成する、ステップと、 前記オーディオ入力信号が前記第1の語彙によって定められた1つ以上のワードを含めば、アプリケーションプロトコルサービス論理の端末アプリケーション部分を用いて、前記第1の語彙によって定められた前記1つ以上のワードをどのように処理すべきかを決定するステップと、 前記オーディオ入力信号の前記非認識部分を、第1の所定のマークアップ言語によって定められた構造を有するデータユニットに含まれるようにフォーマットするステップと、 前記データユニットを、第1のアプリケーションプロトコルに従って動作する第1のディジタルデータリンクを経て遠隔アプリケーション部分へ通信するステップと、 前記遠隔アプリケーション部分において、前記オーディオ入力信号の前記フォーマットされた非認識部分を前記データユニットから抽出し、遠隔アプリケーション部分のサービス論理を用いて、前記オーディオ入力信号の前記フォーマットされた非認識部分をどのように処理すべきかを決定するステップと、 を含む、方法。
IPC (5件):
G06F 3/16 320 ,  G06F 3/16 330 ,  G10L 15/00 ,  G10L 15/22 ,  G10L 15/28
FI (6件):
G06F 3/16 320 H ,  G06F 3/16 330 B ,  G10L 3/00 551 A ,  G10L 3/00 551 P ,  G10L 3/00 561 H ,  G10L 3/00 561 C
Fターム (3件):
5D015AA04 ,  5D015AA05 ,  5D015KK01

前のページに戻る