抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Twitterは近年注目されているマイクロブログの1つであり,検索エンジンによる情報検索では得られないような,即時性や多様性のある情報が得られる。その一方で,固有名詞の類似単語である俗語や略語等が多数登場するため,情報検索において検索エンジンよりも適切なキーワード選択が難しい。そこでTwitter検索支援を目的とした類似単語を考慮したキーワード推薦のために,極大部分文字列による固有名詞の抽出と時系列データの相関および単語の共起確率に基づき固有名詞の類似度判定を行い,類似単語辞書を構成する。また,固有名詞抽出において,反復度を用いた極大部分文字列からノイズとなる部分文字列の除去を行う。2011年末,2012年末のテレビ番組である紅白歌合戦のハッシュタグが付与されたデータに提案手法を用い,形態素解析を用いる手法よりも効果的に類似度判定ができることを示す。(著者抄録)