Pat
J-GLOBAL ID:200903059516327316

音声認識結果出力方法および音声認識結果出力装置ならびに音声認識結果出力処理プログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 上柳 雅誉 (外2名)
Gazette classification:公開公報
Application number (International application number):2001252027
Publication number (International publication number):2003066991
Application date: Aug. 22, 2001
Publication date: Mar. 05, 2003
Summary:
【要約】【課題】音声認識結果としての文字列に話者の口調や感情を表現できるようにする。【解決手段】音声分析部2によって得られた分析結果の中から得られる時刻情報、音量情報、ピッチ情報と、認識結果としての文字列とをそれぞれの時刻によって対応付けて、これら対応付けられた情報を文字パラメータとして出力する文字パラメータ出力部4と、この文字パラメータ出力部4から出力された時刻情報から発話継続時間を求め、その発話継続時間から話速を表現するパラメータ、前記音量情報から声の大きさを表現するパラメータ、前記ピッチ情報から声の高さを表現するパラメータを生成し、それらのパラメータによって、話速、声の大きさ、声の高さが表現された文字列を生成する文字生成手段5を有する。
Claim (excerpt):
入力された音声を分析し、その音声分析結果を用いて音声認識を行い、その認識結果を出力する音声認識結果出力方法において、前記音声分析結果から、発話継続時間情報、音量情報、ピッチ情報の少なくとも1つの情報を取得し、前記発話継続時間情報から話速を表現するパラメータ、音量情報から声の大きさを表現するパラメータ、ピッチ情報から声の高さを表現するパラメータの少なくとも1つのパラメータを生成し、それらのパラメータの中の少なくとも1つのパラメータによって、話速、声の大きさ、声の高さの少なくとも1つが表現された文字列を生成することを特徴とする音声認識結果出力方法。
IPC (4):
G10L 15/22 ,  G06F 3/16 320 ,  G10L 15/02 ,  G10L 15/10
FI (4):
G06F 3/16 320 H ,  G10L 3/00 561 C ,  G10L 3/00 515 Z ,  G10L 3/00 531 N
F-Term (7):
5D015AA06 ,  5D015CC12 ,  5D015CC14 ,  5D015CC15 ,  5D015FF03 ,  5D015HH00 ,  5D015LL05

Return to Previous Page