抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自然言語処理(NLP)において,交差点,または交差言語認証属性のようなクロスドメインテキスト分類問題は,訓練と試験データのための異なるコンテキストを持つことによって特徴付けられる。すなわち,訓練データの特定の特性に関して訓練された学習アルゴリズムは,本質的に異なる特性を含む試験データに関する予測を行う必要がある。この目的のために,交差領域問題における解析に使用されるコーパスは,サイズと変動に制限され,提案された解の表現力と一般化可能性を減少させる。本論文では,数百万のRedditコメントを利用することにより,交差領域データセットを動的に生成するための方法論的フレームワークとツールセットを提示した。著者らは,交差トピックまたは交差言語コーパスのような異なるタイプの交差領域データセットを構築することができて,オリジナルの非翻訳テキストに関する交差言語認証属性のような以前に実行不可能な解析を含む広範囲の使用事例を実証した。最先端のオーサシップ属性法を用いて,関連するアプローチで使用されたコーパスと比較したとき,著者らのフレームワークによって生成されたクロストピックコーパスの可能性を示し,以前に企業の利用可能性によって制限された研究の進歩を可能にした。Copyright 2019 Springer Nature Switzerland AG Translated from English into Japanese by JST.【JST・京大機械翻訳】