特許
J-GLOBAL ID:200903011092129303
自然語辞書更新装置、更新方法、プログラム及び記録媒体
発明者:
出願人/特許権者:
代理人 (1件):
根本 恵司
公報種別:公開公報
出願番号(国際出願番号):特願2003-409843
公開番号(公開出願番号):特開2005-173753
出願日: 2003年12月09日
公開日(公表日): 2005年06月30日
要約:
【課題】自然言語の登録候補語を人手を介することなく辞書データベースに登録する。【解決手段】入力部1からの操作によりリソース取得部2は非固定のコーパスから自然言語コンテンツを取得し、言語解析部3でそのテキストデータの自立語毎に品詞属性と他の自立語との係り受け関係を解析し、言語データ計量部4で当該自立語と係り受け関係を有する他の自立語の出現頻度を計量する。テキストデータ構造生成部5で当該自立語と当該自立語と係り受け関係を有する他の自立語との関係を示すテキストデータ構造情報を生成・記憶する。未登録語属性推定部7は更新しようとする未登録語に品詞属性を仮付与する。未登録語評価部8は登録候補語に係るテキストデータ構造情報を渡され、テキストデータ構造情報を所定の評価基準を参照して評価し、辞書更新部9により品詞属性の仮付与を解いて登録候補語を登録語として更新する。【選択図】図3
請求項(抜粋):
品詞属性が仮付与された自然言語の登録候補語を有する辞書の前記登録候補語を登録語として更新する手段を備えた自然語辞書更新装置において、
常時更新されるコーパスから自然言語コンテンツを取得する手段と、
取得された自然言語コンテンツからテキストデータを抽出する手段と、
抽出されたテキストデータの自立語毎に品詞属性と他の自立語との係り受け関係を解析する手段と、
解析された当該自立語と係り受け関係を有する他の自立語の出現頻度を計量する手段と、
当該自立語と、品詞属性と出現頻度が付与された当該自立語と係り受け関係を有する他の自立語との関係を示すテキストデータ構造情報を生成する手段と、
登録候補語に係るテキストデータ構造情報を取得する手段と、
取得されたテキストデータ構造情報を評価する手段と、
所定の評価が得られたとき登録候補語を登録語として更新する手段と、
を備えたことを特徴とする自然語辞書更新装置。
IPC (1件):
FI (1件):
Fターム (4件):
5B091CA02
, 5B091CA05
, 5B091CC02
, 5B091CC16
引用特許:
前のページに戻る