プレプリント
J-GLOBAL ID:202202209265891820   整理番号:22P0350882

合理的音声法フレームワークによる参照表現:確率的アプローチ【JST・京大機械翻訳】

Referring Expressions with Rational Speech Act Framework: A Probabilistic Approach
著者 (6件):
資料名:
発行年: 2022年05月16日  プレプリントサーバーでの情報更新日: 2022年05月16日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文は,複雑な視覚場面でオブジェクトを出すことを目的とする,参照表現生成(REG)タスクに焦点を合わせた。この問題に対する一つの一般的な理論的アプローチは,「話者エージェントが目標領域を記述する表現を生成し,また,「聴者エージェントがターゲットを同定するという2エージェント協調方式としてタスクをモデル化することである。いくつかの最近のREGシステムは,話者/聴取エージェントを表現するために,深層学習アプローチを使用した。ヒト言語行動を非常に正確に予測できる実用的手法のBayesアプローチである合理的音声法フレームワーク(RSA)は,簡単な視覚シーンを含むトイデータセット上で高品質で説明可能な表現を生成することが示されている。しかし,大規模問題への適用は,ほとんど未調査のままである。本論文では,確率的RSAフレームワークと深層学習アプローチの組合せを,より良い説明表現を生成する目的で,多段階プロセスにおける複雑な視覚シーンを含む大規模データセットに適用した。RefCOCOとRefCOCO+データセットに関する実験を行い,著者らの重要な寄与を強調するためにRSAの変化と同様に,他のエンドツーエンド深層学習アプローチと著者らのアプローチを比較した。実験結果は,SOTA深層学習法より低い精度を達成する間,著者らのアプローチが,人間の理解において類似のRSA方式より優れていて,限られたデータシナリオの下でエンドツーエンドの深い学習に対して優位性を持っていることを示した。最後に,コンクリート事例による発現発生過程の詳細な解析を提供し,従って,発生プロセスにおける誤差タイプと欠陥に関する系統的見解を提供し,将来の改善のための可能な領域を同定した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る