文献
J-GLOBAL ID:202002292793149067   整理番号:20A1825074

オーディオフィンガープリントのためのSAMAFシーケンスからシーケンスへのオートエンコーダモデル【JST・京大機械翻訳】

SAMAF Sequence-to-sequence Autoencoder Model for Audio Fingerprinting
著者 (6件):
資料名:
巻: 16  号:ページ: 1-23  発行年: 2020年 
JST資料番号: W5702A  ISSN: 1551-6857  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
全オーディオサンプルの代わりにオーディオのコンテンツベースコンパクト署名を比較し,メモリと計算費用を削減することにより,オーディオサンプルを索引と検索するために,オーディオ指紋技術を開発した。異なる技術を適用して,オーディオ指紋を作成した。しかし,深層学習の導入により,新しいデータ駆動教師なしアプローチが利用可能である。本論文は,Audio Finger印刷(SAMAF)のための配列対逐次自動符号器モデルを提示し,それは,平均平方誤差,再構成誤差を最小化するという用語から成る新しい損失関数を通してハッシュ生成を改善した。ハッシュロスは,類似したハッシュと有望なクラスタ化の間の距離を最小にする。そして,クラスタ内の変動を最小化する,ビットワイズエントロピー損失。モデルの性能が,VoxCeleb1データセット,”speech in the the based”データセットのサブセットで評価された。さらに,モデルを3つのベースライン:Dejavu,Shazam様アルゴリズムと比較した;ロバストAudio Finger印刷システム(RAFS)は,時間周波数歪みと符号化/復号化変換にロバストであるビット誤り率(BER)方法論である。そして,時間周波数歪みレジリエンスを加える配置ベースのアルゴリズムであるパナコである。広範な経験的証拠は,著者らのアプローチがオーディオ識別タスクにおけるすべてのベースラインと,1秒のオーディオに対して128または256ビットの経済的ハッシュサイズを有するオーディオ信号の属性に関連する他の分類タスクを凌駕することを示した。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  パターン認識 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る