文献
J-GLOBAL ID:202202277124843960   整理番号:22A0969574

Twitterベース文書埋込み,敵対領域適応,および質問展開による文書表現と分類【JST・京大機械翻訳】

Document representation and classification with Twitter-based document embedding, adversarial domain-adaptation, and query expansion
著者 (3件):
資料名:
巻: 28  号:ページ: 211-233  発行年: 2022年 
JST資料番号: W0989A  ISSN: 1381-1231  CODEN: JOHEFD  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
適切な符号化方式による文書化ベクトル化は,テキスト文書分類,検索,または生成を含む様々な文書処理タスクにおける必須成分である。特定のドメインにおける専用文書の訓練は,十分なデータと十分な資源を必要とする。これは,二つの主成分を持つ新しい文書表現方式を提案した。第1に,Twitterにおける1百万以上のツイートから英語文書を埋め込んだ一般的な事前訓練文書であるTD2Vを訓練した。第2に,異なるドメインにTD2Vを適応させるための敵対訓練によるドメイン適応プロセスを提案する。文書を分類するために,質問拡張技法,すなわち平均クエリ拡張または識別質問拡張のいずれかを用いて,その類似文書のランクリストを使用した。異なるオンラインソースからのデータセットに関する実験は,TD2Vだけを用いることによって,著者らの方法が既存の方法より良い精度で文書を分類できることを示した。敵対的適応プロセスを適用することにより,BBC,BBCSport,アマゾン4,20Newsグループデータセットの正確性をさらに高め,達成することができた。また,感度分類の特定の領域に関する著者らの方法を評価し,5つのデータセット,すなわち,Snowden,Mormon,Dyncorp,TM,およびEnronに1024の文字を持つ短いテキストフラグメントでさえ,[数式:原文を参照]より高い精度を達成した。Copyright Springer Science+Business Media, LLC, part of Springer Nature 2019 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 

前のページに戻る