文献
J-GLOBAL ID:200902250739878550   整理番号:08A0992363

機械学習を用いたWeb表情報の例示検索方式とその評価

Query by Example Searching for Web Information in Tabular Formulation And Its Estimation
著者 (6件):
資料名:
巻: IS-08  号: 13-22  ページ: 35-40  発行年: 2008年09月10日 
JST資料番号: L4571A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
検索質問を表形式で例示する例示検索方式ではユーザの検索意図をもとにして問合せを行うので,検索意図を十分に満たす情報を取得できる。具体的には,1)標題,属性,値からなる所望する表の例の入力,2)属性→値の順番で検索単語をANDでつないだものと標題をANDでつないだ検索条件式による検索の実行,3)検索Webページからの表情報の抽出,4)SVM(Support Vector Machine)で生成された分類モデルを用いた表情報の順序付け,5)結果の提示という手順をとる。本論文では,レイアウト目的の表を下位に順序付けるために,4)の機械学習で使用する属性と値の境界を利用したフィーチャにおける境界推定法を検討した。境界を利用したフィーチャとして行または列のどちらか片方でも境界があれば,本質的な表と判断できる。そこで,i)セルが結合された表の正規化,ii)隣接セル間ごとの類似度が最小の位置を境界位置と仮定することで境界存在を推定した。分野の偏りなく表を収集して検索精度を測定したところ,全体的にGoogleの検索結果を表単位に変換した場合や境界を利用したフィーチャを取り除いた場合よりも高くなった。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人間機械系  ,  その他の情報処理  ,  人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る