特許
J-GLOBAL ID:200903015164192574
音声データ検索装置
発明者:
出願人/特許権者:
代理人 (4件):
田澤 博昭
, 加藤 公延
, 田澤 英昭
, 濱田 初音
公報種別:公開公報
出願番号(国際出願番号):特願2004-222121
公開番号(公開出願番号):特開2006-040150
出願日: 2004年07月29日
公開日(公表日): 2006年02月09日
要約:
【課題】 音声データ検索において、複数語を含むクエリに対する検索精度を向上させる。【解決手段】 質問テキスト1から検索単語候補22を抽出し、単語辞書に含まれる既知検索単語28と、未登録の未知検索単語29に分類するクエリ解析部2と、単語辞書中の単語のファイル上での照合位置と照合尤度を登録する既知語インデックス作成部5と、未知検索単語29のファイル上での照合位置と照合尤度を登録する未知語インデックス作成部6と、単語辞書中の単語と未知検索単語29を次元とし、質問テキスト1中での各次元に対応する単語の有無を示す値を成分とする質問ベクトルを生成する質問ベクトル生成部71と、単語辞書中の単語と未知検索単語を次元とし、ファイル上での各次元に対応する単語の最大の照合尤度を成分とする対象ベクトルを生成する対象ベクトル生成部72と質問ベクトルと対象ベクトルの類似度を算出するベクトル類似度計算部73を備える。【選択図】 図1
請求項(抜粋):
入力されたクエリから検索対象となり得る単語を抽出し、単語辞書に登録された単語である既知検索単語と、単語辞書に未登録の単語である未知検索単語に分類するクエリ解析部と、
検索対象の音声ファイル上での、上記単語辞書に登録された単語の照合位置と照合尤度を保有する既知語インデックスを作成する既知語インデックス作成部と、
上記音声ファイル上での、上記未知検索単語の照合位置と照合尤度を保有する未知語インデックスを作成する未知語インデックス作成部と、
上記単語辞書に登録された単語と上記未知検索単語を次元とし、各次元の成分が、上記クエリ中での各次元に対応する単語の有無を示す値である質問ベクトルを、上記既知検索単語と上記未知検索単語を参照して生成する質問ベクトル生成部と、
上記単語辞書に登録された単語と上記未知検索単語を次元とし、各次元の成分が、上記音声ファイル上での各次元に対応する単語の最大の照合尤度である対象ベクトルを、上記既知語インデックスと上記未知語インデックスを参照して生成する対象ベクトル生成部と、
上記質問ベクトルと上記対象ベクトルのベクトル間の類似度を算出するベクトル類似度計算部と、
上記類似度の大きさに基づいて検索結果を出力する検索結果提示部を備えた音声データ検索装置。
IPC (3件):
G06F 17/30
, G10L 15/00
, G10L 15/28
FI (6件):
G06F17/30 170E
, G06F17/30 310Z
, G06F17/30 350C
, G06F17/30 370Z
, G06F17/30 380E
, G10L3/00 551P
Fターム (11件):
5B075ND14
, 5B075NK32
, 5B075PQ02
, 5B075PQ36
, 5B075PQ46
, 5B075PQ74
, 5B075QM05
, 5D015AA01
, 5D015BB01
, 5D015CC17
, 5D015KK03
引用特許:
出願人引用 (17件)
全件表示
審査官引用 (12件)
全件表示
前のページに戻る