特許
J-GLOBAL ID:200903041124345174

音声データベース作成支援システム

発明者:
出願人/特許権者:
代理人 (1件): 植本 雅治
公報種別:公開公報
出願番号(国際出願番号):特願2000-335610
公開番号(公開出願番号):特開2002-140095
出願日: 2000年11月02日
公開日(公表日): 2002年05月17日
要約:
【要約】【課題】 音声データベース作成に伴う困難な作業をできる限り自動化し、作業者に要求される知識や経験、すなわち作業者の労力をより一層軽減させることの可能な音声データベース作成支援システムを提供する。【解決手段】 エディタ手段4は、音素列照合手段2および音素セグメンテーション手段3で得られる(自動的に推定された)音素の境界位置を例えば対話的に修正するための音素境界位置エディタとしての機能とともに、仮名文字単位の区切り情報を含んだ形で展開された音素列候補から中間表現としての音素グラフ構造(リスト構造)を作成し、音素グラフ構造のうち、複数の候補が存在する部分音素列を作業者が選択,変更し易いハイパーテキストの形で表示する機能を有している。
請求項(抜粋):
仮名文字で記述された読みを、それを発声した場合に出現し得る音素列候補に展開するための仮名文字展開手段と、展開された音素列候補に対して実際の音声データに基づいて順位付けを行う音素列照合手段と、音素列照合手段によって得られた最も順位の高い音素列、または、作業者が指定した音素列に従って、音声データの各音素の境界位置を算出する音素セグメンテーション手段と、エディタ手段とを有し、エディタ手段は、音素列照合手段および音素セグメンテーション手段で得られる音素の境界位置を修正するための音素境界位置エディタとしての機能とともに、仮名文字単位の区切り情報を含んだ形で展開された音素列候補から中間表現としての音素グラフ構造を作成し、音素グラフ構造のうち、複数の候補が存在する部分音素列を作業者が選択,変更し易いハイパーテキストの形で表示する機能を有していることを特徴とする音声データベース作成支援システム。
IPC (7件):
G10L 15/22 ,  G06F 17/30 170 ,  G06F 17/30 210 ,  G06F 17/30 230 ,  G10L 15/06 ,  G10L 15/00 ,  G10L 15/28
FI (6件):
G06F 17/30 170 E ,  G06F 17/30 210 C ,  G06F 17/30 230 Z ,  G10L 3/00 561 E ,  G10L 3/00 521 B ,  G10L 3/00 551 P
Fターム (11件):
5B075ND14 ,  5B075NK25 ,  5B075NR02 ,  5B075PP13 ,  5B075PQ02 ,  5B075PQ46 ,  5D015BB02 ,  5D015FF06 ,  5D015FF07 ,  5D015HH04 ,  5D015KK02
引用特許:
審査官引用 (4件)
全件表示
引用文献:
前のページに戻る