特許
J-GLOBAL ID:200903044449932032
音声サンプルのデータベース生成方法
発明者:
出願人/特許権者:
代理人 (1件):
山田 勝重 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-080448
公開番号(公開出願番号):特開2003-280676
出願日: 2002年03月22日
公開日(公表日): 2003年10月02日
要約:
【要約】【課題】 言語化できない情報をキーとすることができ、利用者が対面している物体や認識している現象、未知の情報、キーワードを忘れた物体や現象についての情報検索を音情報により直感的に検索可能なシステムを構築可能とする音声サンプルのデータベース生成方法を提供する。【解決手段】 音声データ中の最大値を検出し、この最大値となる時刻の前後所定範囲(例えば前後0.5秒)にわたる時間間隔をサンプリング対象とする。このサンプリング対象範囲内の音声データの最大値を上限値、最小値を下限値とし、音声データ値の変化を時系列のビットデータとしてとらえる。この時系列ビットデータ中の複数の時刻におけるデータをRGB表色系等の適宜の三色表色系を用いて色ごとに3分割し、これら分割データごとの階調データを生成し、これら階調データによりデータベースを構成する。
請求項(抜粋):
音声データ中の最大値を検出し、該最大値となる時刻の前後所定範囲にわたる時間間隔をサンプリング対象とし、前記サンプリング対象範囲内の前記音声データの最大値を上限値、最小値を下限値とし、前記音声データ値の変化を時系列のビットデータとしてとらえ、前記時系列ビットデータ中の複数の時刻におけるデータをRGB表色系等の適宜の三色表色系を用いて色ごとに3分割し、これら分割データごとの階調データを生成し、これら階調データによりデータベースを構成することを特徴とする音声サンプルのデータベース生成方法。
IPC (4件):
G10L 11/00
, G06F 17/30 170
, G06T 1/00 200
, G10L 13/00
FI (4件):
G06F 17/30 170 E
, G06T 1/00 200 D
, G10L 3/00 A
, G10L 3/00 M
Fターム (13件):
5B050AA06
, 5B050AA08
, 5B050CA07
, 5B050CA08
, 5B050FA05
, 5B050FA10
, 5B050FA13
, 5B050FA19
, 5B050GA08
, 5B075ND14
, 5B075NK06
, 5B075NK24
, 5D045DA20
前のページに戻る