抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,近未来チャレンジ「Wikipediaマイニング」の一貫として,日本語Wikipediaからのオントロジー学習手法を提案した。本手法では,1)Is-a関係,2)クラス-インスタンス関係,3)Infoboxトリプル,4)プロパティ定義域,5)同義語といった関係を自動構築する。1)はカテゴリ階層に対する文字列照合,カテゴリ名とInfoboxテンプレートの照合,目次見出しのスクレイピングによって構築した。2)はスクレイピングによる不要な部分の排除と,6つのパターンを用いたインスタンス箇所の特定によって抽出した。また,3)の抽出は,i)記事ごとのInfoboxとそのテンプレート情報のデータベースへの格納,ii)「インスタンス-プロパティ-リテラル」形式でのデータベースへの格納,iii)Infoboxテンプレートによるプロパティのモデリング,iv)iii)とii)のトリプルから新たなトリプルの抽出という手順をとる。4)ではInfoboxテンプレートで定義されている/定義されていないプロパティに対する抽出法を定め,5)の抽出にはリダイレクトリンクを利用した。評価実験では1)と5)の抽出精度が低かったが,関係数約180万という大規模なオントロジーを構築できた。