特許
J-GLOBAL ID:200903054702760974

類似性評価装置及びプログラム

発明者:
出願人/特許権者:
代理人 (3件): 杉村 興作 ,  藤谷 史朗 ,  来間 清志
公報種別:公開公報
出願番号(国際出願番号):特願2006-110791
公開番号(公開出願番号):特開2007-286721
出願日: 2006年04月13日
公開日(公表日): 2007年11月01日
要約:
【課題】比較する日本語文全体の特徴を考慮することにより、類似性評価の結果の信頼性を向上させることが可能な類似性評価装置及びプログラムを提供する。【解決手段】木構造生成部2が、入力日本語文及び対象日本語文を構文解析し、木構造をそれぞれ生成し、部分構造生成部3が、木構造から部分構造を生成する。部分構造評価部4は、部分構造間の構文上の類似度、及び部分構造間の単語の類似度を算出し、これらの構文上の類似度及び単語の類似度に基づいて部分構造間の類似度を算出する。そして、文評価部5は、部分構造間の類似度に基づいて、入力日本語文と対象日本語文との間の類似度を算出する。【選択図】図1
請求項(抜粋):
第1の日本語文と第2の日本語文との間の類似性を評価する類似性評価装置において、 第1の日本語文及び第2の日本語文から、単語をノードとした係り受け関係を示す木構造をそれぞれ生成する木構造生成部と、 該木構造生成部により生成された第1の日本語文の木構造について、末端の葉ノードを構成する2つの単語を抽出し、該2つの単語間のパスを部分構造として生成すると共に、前記第2の日本語文の木構造について、自立語である2つの単語を抽出し、該2つの単語間のパスを部分構造として生成する部分構造生成部と、 該部分構造生成部により生成された第1の日本語文の部分構造と第2の日本語文の部分構造との間の構文上の類似度を算出し、 前記第1の日本語文の部分構造と第2の日本語の部分構造との間の前記抽出した単語の類似度を算出し、 前記第1の日本語文の部分構造と第2の日本語の部分構造との間の類似度を、前記構文上の類似度及び単語の類似度に基づいて算出する部分構造類似度算出部と、 該部分構造類似度算出部により算出された部分構造間の類似度に基づいて、前記第1の日本語文と第2の日本語文との間の類似度を算出する文類似度算出部とを備えたことを特徴とする類似性評価装置。
IPC (3件):
G06F 17/28 ,  G06F 17/27 ,  G06F 17/30
FI (5件):
G06F17/28 Z ,  G06F17/27 J ,  G06F17/30 170A ,  G06F17/30 330C ,  G06F17/30 350C
Fターム (5件):
5B075ND03 ,  5B075NK32 ,  5B075QM08 ,  5B091AA15 ,  5B091CA05
引用文献:
前のページに戻る