特許
J-GLOBAL ID:201103060535748167
同義語展開システム及び同義語展開方法
発明者:
,
出願人/特許権者:
代理人 (3件):
後藤 政喜
, 藤井 正弘
, 飯田 雅昭
公報種別:公開公報
出願番号(国際出願番号):特願2009-139955
公開番号(公開出願番号):特開2010-287020
出願日: 2009年06月11日
公開日(公表日): 2010年12月24日
要約:
【課題】文書から抽出された単語を、各単語の出現文脈に適した同じ意味を示す同義語に展開する。【解決手段】ある単語の係り先となる単語を含む第1文脈情報が格納された第1データベースを参照して、第1単語の第1文脈情報と第2単語の第1文脈情報とを比較することによって、類似度を計算し、類似度が高い第2単語を第1単語の同義語候補に決定し、ある単語から文章中で所定の語数内に出現する単語を含む第2文脈情報が格納された第2データベースを参照して、第1単語の第2文脈情報と少なくとも一以上の同義語候補の第2文脈情報とを比較することによって、文脈適合度を計算し、類似度及び文脈適合度に基づいて、同義語候補の同義語展開スコアを計算し、同義語展開スコアに基づいて、同義語候補から第1単語の同義語を決定する。【選択図】図1
請求項(抜粋):
単語の同義語を決定する同義語展開システムであって、
プロセッサと、前記プロセッサに接続されるメモリと、記憶装置と、を備える少なくとも一以上の計算機を備え、
前記プロセッサは、前記メモリに格納された同義語展開処理のためのプログラムを実行することによって、
ある単語の係り先となる単語を含む第1文脈情報が格納された第1データベースを参照して、第1単語の前記第1文脈情報と第2単語の前記第1文脈情報とを比較することによって、前記第1単語と前記第2単語との間の意味の近さを示す類似度を計算し、
前記計算された類似度が高い少なくとも一以上の前記第2単語を前記第1単語の同義語候補に決定し、
前記決定された少なくとも一以上の同義語候補とその類似度とを含む第1情報を出力し、
ある単語から文章中で所定の語数内に出現する単語を含む第2文脈情報が格納された第2データベースを参照して、前記第1単語の第2文脈情報と、前記出力された第1情報に含まれる少なくとも一以上の同義語候補の第2文脈情報と、を比較することによって、前記少なくとも一以上の同義語候補が出現する文脈とが一致する確率を示す文脈適合度を計算し、
前記少なくとも一以上の同義語候補の類似度と、前記計算された文脈適合度とに基づいて、前記同義語候補の同義語展開スコアを計算し、
前記少なくとも一以上の同義語候補とその同義語展開スコアとを含む第2情報を出力し、
前記出力された第2情報に含まれる少なくとも一以上の同義語候補のうち、前記計算された同義語展開スコアの高い同義語候補を前記第1単語の同義語に決定し、
前記決定された第1単語の同義語を含む第3情報を出力することを特徴とする同義語展開システム。
IPC (2件):
FI (4件):
G06F17/30 320D
, G06F17/30 330C
, G06F17/30 170A
, G06F17/28 X
Fターム (7件):
5B075ND03
, 5B075PP24
, 5B075QP03
, 5B091AA15
, 5B091AB17
, 5B091CA12
, 5B091CC04
前のページに戻る