特許
J-GLOBAL ID:201103097718241674

略語完全語復元装置とその方法と、プログラム

発明者:
出願人/特許権者:
代理人 (4件): 中尾 直樹 ,  中村 幸雄 ,  義村 宗洋 ,  草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願2010-097649
公開番号(公開出願番号):特開2011-227749
出願日: 2010年04月21日
公開日(公表日): 2011年11月10日
要約:
【課題】略語に対応する完全語を人手に頼らず自動的に抽出する。【解決手段】この発明の略語完全語復元装置は、入力される略語に対する完全語候補をテキストデータベースから検索して複数の完全語候補を抽出し、その複数の完全語候補を意味ごとにまとめ上げ、まとめ上げられた完全語集約候補ごとにトピックベクトルを生成し、外部から入力される略語の特徴ベクトルとの類似度によって、完全語集約候補の中の一つを完全語として選択する。【選択図】図1
請求項(抜粋):
略語を入力としてカッコ付き略語の表記でテキストデータベースを検索し、マッチする文書集合を得る検索部と、 上記文書集合の中の個々の文書から、略語の先頭文字から末尾文字までがマッチする複数の単語列を完全語候補として抽出する完全語候補抽出部と、 複数の上記完全語候補を入力として、上記完全語候補を意味ごとにまとめ上げた完全語集約候補を生成する完全語候補まとめ上げ部と、 上記文書集合と上記完全語集約候補と外部から入力される上記略語を含む文書とを入力として、上記完全語集約候補のそれぞれに対応する文書からその完全語集約候補のトピックベクトルと、上記外部から入力される上記略語を含む文書から略語の特徴ベクトルと、を生成するトピックベクトル生成部と、 上記トピックベクトルと上記略語の特徴ベクトルとの類似度によって、上記完全語集約候補の中の一つを完全語として選択する完全語復元部と、 を具備する略語完全語復元装置。
IPC (2件):
G06F 17/30 ,  G06F 17/21
FI (4件):
G06F17/30 320C ,  G06F17/21 550A ,  G06F17/30 170A ,  G06F17/30 350C
Fターム (5件):
5B075ND03 ,  5B075NR05 ,  5B075QM05 ,  5B109QA01 ,  5B109VA02

前のページに戻る