特許
J-GLOBAL ID:200903001034641597
辞書データ改良装置、辞書データ改良方法および情報記録媒体
発明者:
出願人/特許権者:
代理人 (1件):
岩橋 文雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-343915
公開番号(公開出願番号):特開2000-172690
出願日: 1998年12月03日
公開日(公表日): 2000年06月23日
要約:
【要約】【課題】 大量の対訳文書を用いて、自動的に辞書データベースにおける複数の訳語候補の優先順位の変更を行うことができる辞書データ改良装置、辞書データ改良方法および情報記録媒体を提供することを目的とする。【解決手段】 目的言語で記述された文を形態素単位に分割する目的言語形態素解析処理部5と、原言語で記述された文を形態素単位に分割する原言語形態素解析処理部6と、目的言語の語が目的言語の形態素リストに存在するか否かを確認する利用訳語照合部8と、訳語の優先順位を変更する原言語の辞書登録語を抽出する訳語情報改良データ抽出部10と、辞書データ変更部11とを有し、指定された対訳データベースを対象に処理を行い、訳語情報改良データ抽出部10により訳語情報を変更するデータを抽出し、辞書データ変更部11により、翻訳用辞書データベース12の該データを変更する。
請求項(抜粋):
対象文書の指定や実行指示を行う入力手段と、対訳テキストファイルのテキストを一文ごとに分割する文認定処理部と、目的言語の解析に必要な単語に関する情報を格納した目的言語解析用単語辞書と、原言語から目的言語への翻訳に必要な単語に関する情報を格納した翻訳用単語辞書と、目的言語解析用単語辞書を参照し、目的言語で記述された文を形態素単位に分割する目的言語形態素解析処理部と、翻訳用単語辞書を参照し、原言語で記述された文を形態素単位に分割する原言語形態素解析処理部と、原言語と目的言語で記述されたテキストファイルの形態素解析結果を格納する形態素リスト格納部と、原言語の各形態素の訳語候補である目的言語の語が、目的言語の形態素リストに存在するか否かを確認する利用訳語照合部と、訳語照合結果を格納する訳語出現データ記憶部と、訳語の優先順位を変更する原言語の辞書登録語を抽出する訳語情報改良データ抽出部と、翻訳用辞書データベースの指定された語に関するデータを変更する辞書データ変更部と、翻訳用単語辞書を構成する翻訳用辞書データベースと、データ等を表示する表示手段と、文認定処理部、目的言語形態素解析処理部、原言語形態素解析処理部、利用訳語照合部、訳語情報改良データ抽出部、辞書データ変更部の各機能、および機能間の動作、並びに形態素リスト格納部、訳語出現データ記憶部に格納されたデータの流れを制御する制御部とを有し、訳語情報改良データ抽出部は、訳語出現データ記憶部から、第一優先訳語以外の訳語が使用されている原言語の形態素で、かつ、訳語出現データ記憶部の全データにおいて該原言語形態素の訳語として同一の訳語が使用されている形態素に関するデータを抽出することを特徴とする辞書データ改良装置。
Fターム (3件):
5B091AA03
, 5B091CC02
, 5B091CC11
前のページに戻る