文献
J-GLOBAL ID:201902276871002604   整理番号:19A1089633

メタデータの意味的マッチングに基づくクロス言語レコードリンケージ

Cross-Language Record Linkage based on Semantic Matching of Metadata
著者 (3件):
資料名:
巻: 17  ページ: ROMBUNNO.Article No.1 (WEB ONLY)  発行年: 2019年03月 
JST資料番号: U0983A  ISSN: 2189-0390  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
レコードリンケージは,複数のデータソースを通して同じ実体またはオブジェクトを参照するレコードペアを発見することである。このタスクは,連合検索やデータ統合のような様々な研究分野で重要である。本論文は,レコードが異なる言語によるデータソースから記録されているクロス言語レコードリンケージの新しい課題に焦点を当てた。異なる言語におけるレコードを比較するために,レコードのメタデータをソース言語からターゲット言語に変換する必要がある。これによって翻訳の間に,異なる単語によって類似の意味が時々表現されるので,翻訳されたメタデータとターゲット言語におけるメタデータの間の不整合が生じる。したがって,従来の文字列ベースの類似性測度は,翻訳されたメタデータとターゲット言語におけるメタデータの間の類似性を測定するためには不十分である。そこで本研究では,クロス言語レコードリンケージにおけるミスマッチング問題を扱う手法を提案した。まず,ソース言語の各翻訳メタデータに対して,ターゲット言語における潜在的マッチングメタデータを候補として同定するために,文字列ベースの類似性測度を用いた。次に,翻訳されたメタデータとターゲットと言語におけるその候補マッチングメタデータとの意味マッチングを実行するために単語埋め込みを採用した。この方法を日本語と英語の実世界データセット用いて評価した。筆者等の実験は,提案手法が文字列の類似性または意味マッチング法にのみ依存するベースライン手法よりも優れていることを示している。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
データベースシステム 
引用文献 (31件):
もっと見る

前のページに戻る