Pat
J-GLOBAL ID:200903064770514561

略語抽出方法、略語抽出装置およびプログラム

Inventor:
Applicant, Patent owner:
Agent (1): 川久保 新一
Gazette classification:公開公報
Application number (International application number):2007042935
Publication number (International publication number):2008204399
Application date: Feb. 22, 2007
Publication date: Sep. 04, 2008
Summary:
【課題】入力語句を省略することによって得られる様々な略語について、事前の想定が難しい省略形式による略語であっても、精度高く抽出することができる略語抽出方法、略語抽出装置およびプログラムを提供することを目的とする。【解決手段】入力語句に含まれている文字から、入力語句を構成する文字の数よりも少ない数の文字を取り出し、組み合わせることによって、複数の略語候補を作成し、この作成された複数の略語候補のそれぞれについて、略語候補を含む文書の集合と、入力語句を含む文書の集合とを、外部の文書データベースから取得し、略語候補を含む文書の集合と、入力語句を含む文書の集合との類似度合いを数値化することによって、入力語句についての当該略語候補の略語としての確からしさを示す略語スコアを算出する略語抽出方法である。【選択図】図1
Claim (excerpt):
複数の文書を解析し、入力語句を省略した略語を、自動的に抽出する略語抽出方法において、 上記入力語句に含まれている文字から、上記入力語句を構成する文字の数よりも少ない数の文字を取り出し、組み合わせることによって、複数の略語候補を作成し、記憶装置に記憶する略語候補作成ステップと; 上記略語候補作成ステップで作成された複数の上記略語候補のそれぞれについて、上記略語候補を含む文書の集合と、上記入力語句を含む文書の集合とを、外部の文書データベースから取得し、記憶装置に記憶する文書集合取得ステップと; 上記略語候補を含む文書の集合と、上記入力語句を含む文書の集合との類似度合いを数値化することによって、上記入力語句についての当該略語候補の略語としての確からしさを示す略語スコアを算出し、記憶装置に記憶する略語スコア算出ステップと; を有することを特徴とする略語抽出方法。
IPC (1):
G06F 17/21
FI (1):
G06F17/21 550A
F-Term (6):
5B009ME15 ,  5B009MF02 ,  5B009QA03 ,  5B109ME15 ,  5B109MF02 ,  5B109QA03
Patent cited by the Patent:
Cited by applicant (3) Cited by examiner (1)
Article cited by the Patent:
Return to Previous Page