プレプリント
J-GLOBAL ID:202202206609939925   整理番号:22P0024754

マルチアンスワーとマルチフォーカス質問を持つ抽出臨床質問応答データセットの開発【JST・京大機械翻訳】

Development of an Extractive Clinical Question Answering Dataset with Multi-Answer and Multi-Focus Questions
著者 (4件):
資料名:
発行年: 2022年01月07日  プレプリントサーバーでの情報更新日: 2023年02月09日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
背景:抽出質問回答(EQA)は,彼らの臨床ノートにおける回答を位置決めすることにより患者特異的な質問に答えるための有用な自然言語処理(NLP)アプリケーションである。現実的な臨床EQAは,1つの質問において単一質問と複数の焦点点に複数の回答があり,それは人工知能解の開発のための既存のデータセットに欠けている。目的:自然の多人と多焦点質問を扱うことができる臨床EQAシステムの開発と評価のためのデータセットを作成する。方法:EQAデータセットを生成するために,2018国立NLP臨床チャレンジ(n2c2)コーパスから注釈付き関係を利用した。特に,1-to-N,M-to-1,およびM-to-N薬物-レアソン関係が含まれ,基本的1剤-1-レアソンケースに加えて,より複雑で自然の課題を示すマルチ-スワーおよびマルチフォーカスQAエントリーを形成した。ベースライン解を開発し,データセットで試験した。結果:誘導したRxWhyQAデータセットは,96939QAエントリーを含んだ。回答可能な質問の中で,25%は複数の回答を必要とし,1つの質問の中で複数の薬剤について2%の子を必要とする。テキストにおける回答の周りで観測される頻繁な手がかりがあり,そして,薬物の90%と理由の用語は,同じまたは隣接している文章の中で発生する。ベースラインEQA解は,全データセットで0.72の最良のf1測度を達成し,特定のサブセットで,非回答可能質問で0.93,単一薬剤質問で0.48対多剤質問で0.60,単一回答質問で0.54,マルチ回答質問で0.43であった。考察:RxWhyQAデータセットは,マルチタワーとマルチフォーカス質問を扱う必要があるシステム訓練と評価に使用できる。特に,マルチタワーEQAは挑戦的であり,従って,研究へのより多くの投資を正当化する。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 

前のページに戻る