特許
J-GLOBAL ID:200903067844221080
セグメンテーション補助装置及び媒体
発明者:
,
出願人/特許権者:
代理人 (1件):
松田 正道
公報種別:公開公報
出願番号(国際出願番号):特願平10-216261
公開番号(公開出願番号):特開2000-047683
出願日: 1998年07月30日
公開日(公表日): 2000年02月18日
要約:
【要約】【課題】 音声合成に関する技術では、前処理として高精度の音声セグメンテーションが必要であるが、自然発話の連続音声のセグメンテーションを自動的に完璧に行なうことは極めて困難である。同時に処理の即時処理性や完全自動化の必然性はないので人間による作業が介在することとなる。本発明の目的は、高度な専門知識がない人でも高精度の音声などのセグメンテーションを可能にするインタフェースを構築することである。【解決手段】 セグメンテーション候補を算出する自動セグメンテーション部12を有し、それらの候補を画面に表示して作業者がそれらを選択または修正したり、聴取や読図による確認を行ないながらセグメンテーション作業が行なえるGUI制御による修正部13から構成される。上記構成により高度な専門知識がない作業者にも容易に高精度のセグメンテーションの達成が可能になる。
請求項(抜粋):
音響信号または画像信号を入力する信号入力手段と、前記信号入力手段で入力された前記音響信号または画像信号に対して、自動的にセグメンテーションを行い、セグメント境界の候補を算出する自動セグメンテーション手段と、前記自動セグメンテーション手段で算出された前記セグメント境界の候補を画面に表示し、GUI制御によって前記セグメント境界の候補を確認しながら、前記候補を選択または修正することによりセグメンテーションを行う修正手段と、を備えたことを特徴とするセグメンテーション補助装置。
IPC (3件):
G10L 15/04
, G10L 15/02
, G10L 15/28
FI (3件):
G10L 3/00 515 C
, G10L 5/06 A
, G10L 5/06 D
Fターム (9件):
5D015BB02
, 5D015CC04
, 5D015CC06
, 5D015CC11
, 5D015CC13
, 5D015CC14
, 5D015FF06
, 5D015FF07
, 5D015HH12
前のページに戻る