特許
J-GLOBAL ID:201303030580164077

高速音声検索のための方法、プログラムおよび装置

発明者:
出願人/特許権者:
代理人 (1件): 龍華 明裕
公報種別:特許公報
出願番号(国際出願番号):特願2012-000070
公開番号(公開出願番号):特開2012-133371
特許番号:特許第5210440号
出願日: 2012年01月04日
公開日(公表日): 2012年07月12日
請求項(抜粋):
【請求項1】 マルチプロセッサシステムにおいて音声データベースを検索してターゲット音声クリップを特定する方法であって、 前記音声データベースを複数のグループに分割する段階と、 前記ターゲット音声クリップについてモデルを構築する段階と、 前記マルチプロセッサシステムの複数のプロセッサに対して前記複数のグループを動的にスケジューリングする段階と、 前記ターゲット音声クリップを検索するために、前記複数のプロセッサを用いて前記スケジューリングされた複数のグループを並列に処理する段階と を備え、 前記スケジューリングされた複数のグループを並列に処理する段階は、 前記スケジューリングされた複数のグループのそれぞれを複数のセグメントに分割する段階と、 前記ターゲット音声クリップに含まれる最初の一部のフレームに対して仮モデルを構築し、少なくとも1つの前記セグメントに含まれる最初の一部のフレームに対して仮モデルを構築し、構築した両方の前記仮モデルの仮類似性測度を求める段階と、 前記仮類似性測度が両方の前記仮モデルが類似することを示す場合、各前記セグメントについてモデルを構築し、前記ターゲット音声クリップの前記モデルと各前記セグメントの前記モデルとの類似性測度を求め、前記類似性測度に基づいて、前記セグメントは前記ターゲット音声クリップと一致すると決定する段階と、 前記類似性測度に基づいて、直後の前記セグメントの処理を省略する段階と、 を有する方法。
IPC (4件):
G06F 17/30 ( 200 6.01) ,  G10L 25/54 ( 201 3.01) ,  G10L 15/06 ( 201 3.01) ,  G10L 15/32 ( 201 3.01)
FI (5件):
G06F 17/30 170 E ,  G06F 17/30 350 C ,  G10L 11/00 402 B ,  G10L 15/06 400 V ,  G10L 15/28 220 Z
引用特許:
出願人引用 (8件)
全件表示
審査官引用 (10件)
全件表示

前のページに戻る