特許
J-GLOBAL ID:200903039873764294

音声解析処理およびそれを用いた音声処理装置および媒体

発明者:
出願人/特許権者:
代理人 (2件): 西山 恵三 ,  内尾 裕一
公報種別:公開公報
出願番号(国際出願番号):特願2003-410339
公開番号(公開出願番号):特開2005-173008
出願日: 2003年12月09日
公開日(公表日): 2005年06月30日
要約:
【課題】 音声データを解析し話者弁別を実際に行う場合、特に該音声データが短い等の情報量の不足で話者弁別が困難な話者弁別不可能な音声データに対する考慮が不十分であり、又、1人の話者を複数話者に間違える事があった。【解決手段】 音声区間検出と解析処理を全体に対して行なった後、弁別するための情報量の多い発声区間の順位を求め、この順番に発声者弁別を行なう事により性能向上を図る。また、情報量の不足する発声区間の判定を留保し、一度解析が終わり、話者特徴情報が充実してから再処理する事により話者弁別の精度を上げる。更に、検出した話者同志の特徴を比較し、1人の話者を複数話者に間違えるミスを減らす。【選択図】 図1
請求項(抜粋):
人の発声およびその区間を検出する手段を有し、 発声の個人特徴を抽出する手段を有し、 各個人毎にその発声区間情報を記憶する処理に於いて、 全ての発声区間の発声個人特徴を抽出した後その個人特徴が充実した発声区間順に処理順番を決定する事により個人特徴が充実した発声区間を優先して処理を行いまずその情報量が予め定められた条件を満たさない場合には発声者不明の発声区間として単独の発声者の扱いで解析結果情報へ記憶し、個人特徴を抽出しその情報量が予め定められた条件を満たす場合にはこれを既に検出した人物の発声の個人特徴と比較を行う事により既に検出した人物とは別の人物であると推定した場合には新規の人物としてその発声の個人特徴とその発声区間を合わせて解析結果情報に記憶し、 或いは既に検出した人物と同一人物であると推定した場合には解析結果情報に発声区間を追記する事により全ての全ての発声区間を登場人物単位で参照可能な解析結果情報を記憶することを特徴とする音声処理装置。
IPC (8件):
G10L17/00 ,  G10L11/02 ,  G10L15/02 ,  G10L15/04 ,  G10L15/06 ,  G10L15/10 ,  G10L15/22 ,  G10L15/28
FI (10件):
G10L3/00 545B ,  G10L3/00 513Z ,  G10L3/00 521J ,  G10L3/00 515Z ,  G10L3/00 571U ,  G10L3/00 571K ,  G10L9/02 301B ,  G10L3/00 531Z ,  G10L9/00 301B ,  G10L9/16 301B
Fターム (6件):
5D015AA03 ,  5D015CC04 ,  5D015CC11 ,  5D015HH04 ,  5D015LL02 ,  5D015LL10

前のページに戻る