特許
J-GLOBAL ID:200903065355066584

自然言語の集合に出現しうるワ-ドの集合をグル-プ化する方法

発明者:
出願人/特許権者:
代理人 (1件): 中島 淳 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-349936
公開番号(公開出願番号):特開2000-181919
出願日: 1999年12月09日
公開日(公表日): 2000年06月30日
要約:
【要約】【課題】 自然言語の集合に出現しうるワードの集合をグループ化する方法の提供。【解決手段】 自然言語に出現する接尾語間の集合の関係の各々の関連値を示す接尾語関連データを自動的に得、この関係の関連値は、例えば、自然言語からのワードの集合中の接尾語の出現頻度である。更に、接尾語関連データからの関連値を用いて、ワードの集合の自動クラスタリングを実行し、ここで、グループ中の2つ又はそれ以上のワードは、関係のうちの1つと同様の接尾語を、また、接尾語の前に等価の文字列を有する。
請求項(抜粋):
自然言語の集合に出現しうるワードの集合をグループ化する方法であって、前記自然言語の集合に出現する接尾語間の関係各集合の関連値を示す接尾語関連データを自動的に得、前記接尾語関連データの関連値を用いて、前記ワードの集合中のワードを自動的にクラスタリングして、グループ中の2つ又はそれ以上のワードが前記関係のうちの1つと同様の接尾語、及び該接尾語の前に等価の文字列を有する、ワードのグループを示すグループデータを得る、自然言語の集合に出現しうるワードの集合をグループ化する方法。
IPC (2件):
G06F 17/28 ,  G06F 17/30
FI (3件):
G06F 15/38 C ,  G06F 15/401 310 D ,  G06F 15/403 330 C

前のページに戻る