特許
J-GLOBAL ID:200903001269535441

単語間表記類似度の計算方法

発明者:
出願人/特許権者:
代理人 (1件): 大西 健治
公報種別:公開公報
出願番号(国際出願番号):特願平7-221599
公開番号(公開出願番号):特開平9-062685
出願日: 1995年08月30日
公開日(公表日): 1997年03月07日
要約:
【要約】【課題】 検索語と該検索語により検索される索引語との間の表記類似度の計算方法の効率を改善する。【解決手段】 縦軸に取られた検索語K“eudora”に対して横軸に取られた索引語I“eudra ”があったとすると、これは“o ”の脱落である。そのため、脱落のコストが1及び検索語Kと索引語Iの文字数の和が11なので、単語間距離は1/11となる。1からこの単語間距離1/11を引いたものをキーワード間表記類似度とし、これが或る閾値以上であれば検索結果として出力することにすれば、少々のスペルミスは救済されることになる。閾値は0.8程度が妥当であるが、検索の用途によって動的に決めるのが良い。
請求項(抜粋):
検索語と該検索語により検索される索引語との間の表記類似度を計算する単語間表記類似度の計算方法において、前記検索語を構成する各文字と前記索引語を構成する各文字との一致/不一致を1文字ずつ順次照合し、それらの各照合結果に応じた重みの総和の前記検索語を構成する文字の数と前記索引語を構成する文字の数との総和に対する割合を求めて前記表記類似度とする表記類似度計算処理を、行うことを特徴とする単語間表記類似度の計算方法。

前のページに戻る