プレプリント
J-GLOBAL ID:202202203535290922   整理番号:22P0208264

プリズムを通した言語:マルチスケール言語表現のためのスペクトルアプローチ【JST・京大機械翻訳】

Language Through a Prism: A Spectral Approach for Multiscale Language Representations
著者 (3件):
資料名:
発行年: 2020年11月09日  プレプリントサーバーでの情報更新日: 2020年11月09日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
言語は,サブワードから単語,文,パラグラフ,および文書までの異なるスケールで構造を示す。どの程度深いモデルがこれらのスケールで情報を捉えるか,そして,著者らは,それらをこの階層構造を通してより良い捕獲構造に力づけることができる。著者らは,個々のニューロンに焦点を合わせてこの問題にアプローチし,異なる時間スケールでのそれらの活性化の挙動を分析した。信号処理は,スケールを横切る構造を分離するための自然なフレームワークを提供し,既存の埋込みにおけるスケール固有の情報と2)より特定のスケールを学習するための訓練モデルを可能にすることを示した。具体的には,入力を横切るニューロンの活性化にスペクトルフィルタを適用し,音声タグ付け(語レベル),対話音声行動分類(発話レベル),またはトピック分類(文書レベル)の一部でよく機能するフィルタリング埋込みを生成し,一方,他のタスクではほとんど実行しなかった。また,異なるスケールにおける構造をモデル化するために,異なるニューロンを制約するためにスペクトルフィルタを使用する訓練モデルのためのプリズム層を提示した。提案したBERT+Prismモデルは,長範囲コンテキストを用いてマスクトークンをより良く予測でき,発話と文書レベルタスクでより良いマルチスケール表現を生成する。この方法は一般的であり,画像,オーディオ,ビデオのような言語以外の他のドメインに容易に適用可能である。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
情報加工一般  ,  パターン認識  ,  自然語処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る