特許
J-GLOBAL ID:200903095721188287

多言語単語分類装置及び多言語単語分類プログラム

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  多田 悦夫
公報種別:公開公報
出願番号(国際出願番号):特願2007-147849
公開番号(公開出願番号):特開2008-299777
出願日: 2007年06月04日
公開日(公表日): 2008年12月11日
要約:
【課題】単語の持つ統計的な特徴を用いることなく、単語の品詞が分類された電子辞書が用意できなくても、当該言語に含まれる単語を内容語と機能語とに分類することができる多言語単語分類装置及び多言語単語分類プログラムを提供する。【解決手段】多言語単語分類装置1は、複数の単語を含む単語リストが備えられる複数の言語と、内容語と機能語とが分類されていない対象言語とが、同一の文字列から構成される又は同一の文字を予め設定した個数以上含む場合に、前記単語リストを用い、前記対象言語の単語を、内容語と機能語とに分類するものであって、単言語内単語類似度計算手段3と、単語リスト群記憶手段5と、多言語間単語類似度計算手段7と、単語判定手段9と、を備えた。【選択図】図1
請求項(抜粋):
複数の単語を含む単語リストが備えられる複数の言語と、内容語と機能語とが分類されていない対象言語とが、同一の文字列から構成される又は同一の文字を予め設定した個数以上含む場合に、前記単語リストを用い、前記対象言語の単語を、内容語と機能語とに分類する多言語単語分類装置であって、 複数の前記単語リストからなる単語リスト群を記憶した単語リスト群記憶手段と、 この単語リスト群記憶手段に記憶されている単語リスト群の各単語リストに含まれる単語を構成する文字と、入力された前記対象言語の単語を構成する文字との一致する個数及び文字が出現する順序に基づいて、前記単語リストに含まれる複数の単語に対し、前記単語リストに含まれる単語と前記対象言語の単語とが類似する度合いを示す単言語内単語類似度を計算し、この単言語内単語類似度が最大となる最大単言語内単語類似度を、前記言語ごとに出力する単言語内単語類似度計算手段と、 この単言語内単語類似度計算手段で出力された複数の最大単言語内単語類似度について、予め設定した第一閾値未満の最大単言語内単語類似度を除外して、平均値を取る多言語間単語類似度計算手段と、 この多言語間単語類似度計算手段で計算された平均値が予め設定した第二閾値以上の場合に、前記対象言語の単語を内容語と判定し、前記第二閾値未満の場合に前記対象言語の単語を機能語と判定する単語判定手段と、 を備えることを特徴とする多言語単語分類装置。
IPC (1件):
G06F 17/28
FI (1件):
G06F17/28 U
Fターム (4件):
5B091AA01 ,  5B091AA15 ,  5B091AB00 ,  5B091CC16

前のページに戻る