プレプリント
J-GLOBAL ID:202202201469630501   整理番号:22P0295133

エンティティ解決の探索空間を減らす方法:ブロッキングまたは最近傍探索によるか?【JST・京大機械翻訳】

How to reduce the search space of Entity Resolution: with Blocking or Nearest Neighbor search?
著者 (6件):
資料名:
発行年: 2022年02月25日  プレプリントサーバーでの情報更新日: 2022年10月06日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
エンティティ分解能は二次時間複雑性に悩まされる。その時間効率を上げるために,3種類のフィルタリング技法を,その探索空間を制限するために,通常使用する。(i)同一または類似の署名を持つエンティティプロファイル,(ii)ストリング類似性結合アルゴリズム,が閾値より類似なエンティティを素早く検出する,そして(iii)最近傍法,(iii)各エンティティプロファイルをベクトルに変換し,特定の距離関数に従って最も近いエンティティを素早く検出する最近傍法。各タイプに対して多数の方法が提案されてきたが,文献は相対的な性能の比較分析が不足している。本研究で示すように,これは,各フィルタリング技術の性能に対する構成パラメータの影響により,非自明なタスクである。10の実世界データセットに対するタイプ当りの主な方法の相対的性能を調べる最初の系統的実験研究を行った。各方法に対して,著者らは,リコールと精度に関してそれを最適化することで,パラメータ構成の過多を考慮した。各データセットに対して,スキーマ診断とスキーマベース設定の両方を考察した。実験結果は,考察した技術の有効性と時間効率への新しい洞察を提供し,ブロッキングワークフローとストリング類似性結合の優位性を実証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  その他のオペレーションズリサーチの手法  ,  人工知能  ,  その他の情報処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る