特許
J-GLOBAL ID:200903024855740887
表記揺れ対応辞書作成システム
発明者:
,
,
出願人/特許権者:
代理人 (1件):
平木 祐輔
公報種別:公開公報
出願番号(国際出願番号):特願2004-174516
公開番号(公開出願番号):特開2005-352888
出願日: 2004年06月11日
公開日(公表日): 2005年12月22日
要約:
【課題】着目する用語を中心として文書に起こりうる表記揺れを効率的に漏れなく収集する。【解決手段】大規模な用語集合の中から表記揺れ候補と考えられる用語を予め選別しておき、表記揺れ候補となった用語に対してコストを調整した編集距離を測ることにより、表記揺れの候補となった用語の中から表記揺れと考えられる用語を収集する。【選択図】図4
請求項(抜粋):
検索語として与えられた用語の表記揺れを抽出するシステムにおいて、
テキスト文書から用語の集合を収集する用語収集部と、
前記用語収集部によって収集された用語の集合の中から前記検索語に類似した用語群を検索する類似用語検索部と、
前記類似用語検索部によって検索された用語群の中から前記検索語の表記揺れを抽出する表記揺れ検索部とを備え、
前記類似用語検索部は、1文字ずつずらした隣接する所定長の部分文字列の共有度を基準にして、比較する2つの用語の類似度を判定し、
前記表記揺れ検索部は、前記検索語との編集距離の総コストが与えられた閾値より小さい用語を前記検索語の表記揺れとして抽出することを特徴とする表記揺れ抽出システム。
IPC (2件):
FI (4件):
G06F17/30 320D
, G06F17/30 170J
, G06F17/30 350C
, G06F17/21 550K
Fターム (10件):
5B009QA15
, 5B009QA16
, 5B009VA02
, 5B075KK33
, 5B075KK37
, 5B075ND03
, 5B075NK35
, 5B075QM02
, 5B075QM05
, 5B075UU06
引用特許:
前のページに戻る