Pat
J-GLOBAL ID:200903097819158010
情報推薦装置、情報推薦システム、情報推薦方法、プログラム及び記録媒体
Inventor:
,
Applicant, Patent owner:
Agent (1):
丸山 隆夫
Gazette classification:公開公報
Application number (International application number):2008069763
Publication number (International publication number):2009223781
Application date: Mar. 18, 2008
Publication date: Oct. 01, 2009
Summary:
【課題】選択された第一の文書に関連・類似する文書を選択する情報推薦装置、情報推薦システム、情報推薦方法、プログラム及び記録媒体を提供する。【解決手段】文書データベースに格納された各文書の特徴語句を抽出する際に、各文書を形態素解析等して係り受け関係にある複数単語からなるフレーズを抽出し、前記フレーズを構成する各単語が文書データベース全体の中に出現する頻度・偏りの程度を求め、前記頻度・偏りから算出した積の値の大きさを、前記フレーズの優先度とし、優先度が一定値以上のフレーズを特徴語句とし、各文書と特徴語句との対応付けを作成し、これを特徴フレーズインデックスに保持し、出力された推薦文書に対する特定文書選択情報を入力として、特徴フレーズインデックスを検索し、選択文書に対する特徴フレーズを取得し、これを入力として特徴フレーズインデックスを検索し、入力したフレーズを特徴フレーズとする文書を取得する。【選択図】図1
Claim (excerpt):
推薦する文書の候補となる文書群を格納した文書データベースと、
前記文書データベースに格納された各文書の特徴語句を抽出する際に各文書を形態素解析または構文解析して係り受け関係にある複数単語からなるフレーズを抽出し、抽出したフレーズを構成する各単語が、文書データベース全体の中に出現する頻度を計算し、抽出したフレーズを構成する各単語が、文書データベース全体の中に出現する偏りの程度を計算し、抽出したフレーズを構成する各単語について、前記出現の頻度と偏りとの積を計算し、該積の値の大きさを抽出したフレーズの優先度として、抽出した複数のフレーズの中から、前記優先度が一定値以上のフレーズを特徴語句とし、各文書と特徴語句との対応付けを作成するインデックス作成手段と、
前記インデックス作成手段で作成した各文書と特徴語句との対応付けを保持した特徴フレーズインデックスと、
推薦文書を出力する推薦文書出力手段と、
前記出力された推薦文書に対して特定の文書が選択されたという情報を受け取る選択文書受付手段と、
前記選択文書受付手段にて受け付けた選択文書を入力として、前記特徴フレーズインデックスを検索し、選択文書に対する特徴フレーズを取得する特徴フレーズ取得手段と、
前記特徴フレーズ取得手段から、選択文書と対応する特徴フレーズとを受け取り、前記特徴フレーズを入力として前記特徴フレーズインデックスを検索し、入力したフレーズを特徴フレーズとする文書を前記文書データベースから取得する類似文書群取得手段と、
を有することを特徴とする情報推薦装置。
IPC (1):
FI (3):
G06F17/30 350C
, G06F17/30 210A
, G06F17/30 170A
F-Term (4):
5B075ND03
, 5B075NK39
, 5B075QM05
, 5B075UU06
Patent cited by the Patent:
Return to Previous Page