文献
J-GLOBAL ID:201802241302378556   整理番号:18A0441129

音声の教師なしセグメンテーションおよびクラスタリングのための埋め込まれた段階的K平均モデル【Powered by NICT】

An embedded segmental K-means model for unsupervised segmentation and clustering of speech
著者 (3件):
資料名:
巻: 2017  号: ASRU  ページ: 719-726  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ラベルなし音声の教師なしセグメンテーションおよびクラスタリングは零資源音声処理におけるコア問題である。手法の大部分は,方法論的極値である:いくつかは収束保証を伴う確率的Bayesモデルを用い,一方,他のものはより効率的な発見的技術の選択。以前の研究で比肩可能な性能にもかかわらず,完全Bayes手法である大規模音声コーパスにスケールすることは困難である。はまだ明確な目的関数を持つがハードクラスタリングとセグメンテーションよりもむしろ完全Bayes推論を用いて効率を改善することを最近のBayesモデルに近似を導入した。Bayes対応物のように,この埋込み段階的K平均モデル(ES KMeans)は,固定次元音響単語埋込みとして任意長単語セグメントを示した。最初の共通英語とXitsongaデータセット(5時間および2.5時間音声)に関する以前のアプローチとESのKmeansを比較した:ES Kmeansは単語分割の主要発見的方法よりも優れており,ハイパーパラメータの少ない5倍速いが,Bayesモデルに類似したスコアを与えた。しかし,そのクラスタは他のモデルよりも純粋であった。ES Kmeansは零資源音声挑戦2017(45時間まで)の5言語にそれを適用することによってより大きなコーパスにスケールすることを示し,それは挑戦ベースラインと比較して競合する。~1Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る