生物医学用語の意味論的関連性と類似性:WordD2VECの性能に対する生物医学刊行物の回復,サイズ,およびセクションの影響の調査【JST・京大機械翻訳】

Zhu Yongjun; Yan Erjia; Wang Fei

文献

J-GLOBAL ID：201802265007113562 整理番号：18A1033222

生物医学用語の意味論的関連性と類似性:WordD2VECの性能に対する生物医学刊行物の回復,サイズ,およびセクションの影響の調査【JST・京大機械翻訳】

Semantic relatedness and similarity of biomedical terms: examining the effects of recency, size, and section of biomedical publications on the performance of word2vec

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A1033222&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A1033222&from=J-GLOBAL&jstjournalNo=U7433A") }}

著者 (3件)： , ,
資料名：
巻： 17 号： 1 ページ： 95 発行年： 2017年
JST資料番号： U7433A ISSN： 1472-6947 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：イギリス (GBR) 言語：英語 (EN)

【背景】生物医学用語間の独立した意味論的関連性と類似性は,生物医学情報検索,情報抽出,および推薦システムのような様々な応用に大きな影響を及ぼす。本研究の目的は,大きな出版データから生物医学用語間の意味論的関連性と類似性を引き出すことにおける単語2vecの能力を調べることである。特に,著者らは,単語2vecの性能に及ぼす生物医学出版データのrecy,サイズ,およびセクションの影響に焦点を合わせた。【方法】著者らは,PubMedからの18777,129の論文とPubMed中央(PMC)からの766,326のフルテキスト論文の抽象化をダウンロードする。データセットを前処理し,リcen,サイズ,およびセクションによってサブセットにグループ化した。Word2vecモデルをこれらのサブテストで訓練した。単語2vecモデルから得られた生物医学用語間の余弦類似性を参照標準に対して比較した。異なるサブセットで訓練されたモデルの性能を比較し,リcen,サイズ,およびセクション効果を調べた。結果:最近のデータセットで訓練されたモデルは,性能を上げなかった。より大規模なデータセットで訓練されたモデルは,関連性タスクにおけるより小さなデータセットで訓練されたモデルより多くの生物医学用語を同定した(10%レベルで368から100%レベルで494まで),類似性タスク(10%レベルで374から100%レベルで491まで)。抽象的に訓練されたモデルは,参照標準とのより高い相関を持つ結果を示した。これは,論文体で訓練されたもの(類似性タスクで0.65対0.62,関連性タスクで0.66対0.59)よりも高い相関を持っている。しかし,後者は前者よりも多くの生物医学用語を同定した(すなわち,類似性タスクで344対498,関連性タスクで339対503)。結論:データセットのサイズを増加させることは,必ずしも性能を強化しない。データセットのサイズの増加は,より良い精度を保証しないが,生物医学用語のより多くの関係の同定をもたらすことができる。研究論文の要約として,論文体と比較して,抽出は精度で優れているが,識別可能な関係の範囲で失われている。Copyright 2018 The Author(s). All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , ,
, , , , 【Automatic Indexing@JST】

著者キーワード (6件)： , , , , ,

医用情報処理

引用文献 (24件)：

J Biomed Inform; Measures of semantic similarity and relatedness in the biomedical domain; T Pedersen, SVS Pakhomov, S Patwardhan, GG Chute; 40; 3; 2007; 288-299; 10.1016/j.jbi.2006.06.004; CR1;
Garla V, Brandt C. Semantic similarity in the biomedical domain: an evaluation across knowledge sources. BMC Bioinformatics. 2012;13(1):261-1.
PLoS Comput Biol; Semantic similarity in biomedical ontologies; C Pesquita, D Faria, A Falcao, P Lord, F Couto; 5; 7; 2009; 10.1371/journal.pcbi.1000443; CR3;
Expert Syst Appl; Ontology-based semantic similarity: a new feature-based approach; D Sánchez, M Batet, D Isern, A Valls; 39; 9; 2012; 7718-7728; 10.1016/j.eswa.2012.01.082; CR4;
Knowl Inf Syst; A new semantic relatedness measurement using WordNet features; MA Hadj Taieb, M Ben Aouicha, HA Ben; 41; 2; 2014; 467-497; 10.1007/s10115-013-0672-4; CR5;

, , , , , , , , ,

前のページに戻る