プレプリント
J-GLOBAL ID:202202205084582056   整理番号:22P0324300

ペア付きトレーニングデータなしの音声からの名前付きエンティティ認識のためのエンドツーエンドモデル【JST・京大機械翻訳】

End-to-end model for named entity recognition from speech without paired training data
著者 (4件):
資料名:
発行年: 2022年04月02日  プレプリントサーバーでの情報更新日: 2022年04月02日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最近の研究では,エンドツーエンドニューラルアプローチが話し言葉言語理解(SLU)のために非常に一般的になる傾向があることを示した。用語エンドツーエンドを通して,音声信号から直接意味情報を抽出するために最適化した単一モデルの使用を考察した。そのようなモデルの主要な問題は,意味的アノテーションによる対オーディオとテキストデータの欠如である。本論文では,ゼロ対音声データが利用できるシナリオにおける意味情報を抽出するためのエンドツーエンドニューラルモデルを構築する手法を提案した。この手法は,テキストからベクトル表現のシーケンスを生成するために訓練された外部モデルの使用に基づいている。これらの表現は,音声信号を処理することにより,エンドツーエンド自動音声認識(ASR)モデル内で生成される隠れ表現を模倣する。次に,SLUニューラルモジュールを入力としてこれらの表現と出力として注釈付きテキストを用いて訓練した。最後に,SLUモジュールは,エンドツーエンドモデルの構築を達成するために,ASRモデルのトップ層を置き換える。QUAEROコーパス上で実行したエンティティ認識に関する著者らの実験は,このアプローチが非常に有望であり,比較可能なカスケードアプローチまたは合成音声の使用よりも良い結果を得ることを示す。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  音声処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る