プレプリント
J-GLOBAL ID:202202215231349236   整理番号:22P0280367

クロスリンガル自動音声認識による音声在庫の発見【JST・京大機械翻訳】

Discovering Phonetic Inventories with Crosslingual Automatic Speech Recognition
著者 (8件):
資料名:
発行年: 2022年01月26日  プレプリントサーバーでの情報更新日: 2022年01月27日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
データ収集のコストが高いのは,書かれたスクリプトを持たない言語,あるいは電話インベントリが未知のままである言語を含む,ほとんどの既存の言語に対して問題となる自動音声認識(ASR)モデル訓練を行う。過去の研究は,これらの低資源言語のためのASRシステムを構築するために,多言語訓練,転送学習,およびゼロショット学習を調査した。複数言語からの資源のプールは有用であることが示されているが,訓練中の言語に対するASRモデルの成功した適用はまだ見受けていない。見えない言語からのASRの適応における重要なステップは,非意味言語の電話インベントリの生成である。本研究の究極の目標は,言語に関する知識なしに教師なし方法で訓練中の言語の電話インベントリを構築することである。本論文では,1)未知の言語における音素認識に対する異なる因子(即ち,モデルアーキテクチャ,発音モデル,音声表現のタイプ)の影響を調べた。2)自動電話インベントリ作成のための更なる改善のための制限と領域の理解のためには,言語を横断して電話を転送する分析を提供する。および3)教師なし方法で,非意味言語の電話インベントリを構築するための異なる方法を提示する。そのために,13の音韻的に多様な言語といくつかの徹底的な分析のセットについて,モノ,マルチ,およびクロスリンガル実験を行った。著者らは,よく認識された交差言語である,多くのユニバーサル音トークン(IPA記号)を見出した。結果の詳細な分析を通して,著者らは,独特の音,類似した音,および音色言語が音韻在庫発見のための主要な課題のままであると結論づける。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る