Pat
J-GLOBAL ID:200903047957922840

文書類似性導出装置、文書類似性導出方法、及び、文書類似性導出プログラム

Inventor:
Applicant, Patent owner:
Agent (1): 平井 安雄
Gazette classification:公開公報
Application number (International application number):2007217172
Publication number (International publication number):2009053743
Application date: Aug. 23, 2007
Publication date: Mar. 12, 2009
Summary:
【課題】文書間の類似性を精度よく求める新たな手法を提供する。【解決手段】複数に分類された文書群と入力文書との類似性を導出し、当該入力文書の処理を実行する文書類似性導出装置において、前記入力文書に含まれる文を形態素解析する形態素解析処理部415と、前記形態素解析手段処理部415が解析した結果に基づいて、重みを要素とした前記入力文書の特徴ベクトルを算出する特徴ベクトル算出処理部420と、前記複数に分類された各文書群に含まれる各文書の特徴ベクトルから当該文書群の平均特徴ベクトルを算出する平均特徴ベクトル算出処理部425と、前記特徴ベクトル算出処理部420が算出した前記入力文書の特徴ベクトル及び前記平均特徴ベクトル算出処理部425が算出した前記各文書群の平均特徴ベクトルから、当該入力文書が当該各文書群のうち、いずれの文書群に最も類似するかを判定する類似性判定処理部450とを備えることを特徴とする。【選択図】図3
Claim (excerpt):
複数に分類された文書群と入力文書との類似性を導出し、当該入力文書の処理を実行する文書類似性導出装置において、 前記入力文書に含まれる文を形態素解析する形態素解析手段と、 前記形態素解析手段が解析した結果に基づいて、重みを要素とした前記入力文書の特徴ベクトルを算出する特徴ベクトル算出手段と、 前記複数に分類された各文書群に含まれる各文書の特徴ベクトルから当該文書群の平均特徴ベクトルを算出する平均特徴ベクトル算出手段と、 前記特徴ベクトル算出手段が算出した前記入力文書の特徴ベクトル及び前記平均特徴ベクトル算出手段が算出した前記各文書群の平均特徴ベクトルから、当該入力文書が当該各文書群のうち、いずれの文書群に最も類似するかを判定する類似性判定手段と、を備えることを特徴とする、文書類似性導出装置。
IPC (1):
G06F 17/30
FI (2):
G06F17/30 220Z ,  G06F17/30 170A
F-Term (4):
5B075ND03 ,  5B075NK06 ,  5B075NR20 ,  5B075UU05
Patent cited by the Patent:
Cited by applicant (1)
  • 回答支援装置
    Gazette classification:公開公報   Application number:特願2000-085396   Applicant:エヌ・ティ・ティ・コムウェア株式会社

Return to Previous Page