特許
J-GLOBAL ID:200903031257297568

アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 磯村 雅俊 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-324892
公開番号(公開出願番号):特開2001-142877
出願日: 1999年11月16日
公開日(公表日): 2001年05月25日
要約:
【要約】【課題】 従来は、英語等のアルファベット単語の日本語読みへの高精度な変換を任意の単語に対して簡易かつ低コストで行うことができない。【解決手段】 本発明のアルファベット・日本語読み対応付け装置1は、例えば英単語とカタカナの任意の部分文字列間について要素間距離を計算する手段1aと最小距離対応付けを探索する手段1bとを備え、英文字とカタカナの対応付けを自動的に処理できる。また、本発明の英単語カタカナ音訳装置2は、アルファベット・日本語読み対応付け装置1で生成された英文字とカタカナ対応データから音訳モデルを作成する手段2aと、その音訳モデルに基づいて英単語とカタカナの同時出現確率を計算する手段2bと、同時出現確率が最大となる経路を探索する手段2cを備え、任意の英単語について最適なカタカナ音訳を行うことができる。
請求項(抜粋):
対で入力されたアルファベット単語と該アルファベット単語の日本語読みとに基づき、上記アルファベット単語を構成する文字列と該文字列に対する日本語読みとを対応付けたデータを生成するアルファベット文字・日本語読み対応付け装置であって、予め対で入力されたアルファベット文字列と該アルファベット文字列の1以上の日本語読みとを対応付けて記憶する記憶手段と、上記アルファベット単語と該アルファベット単語の日本語読みとの対が入力されると、該アルファベット単語を構成する文字列と上記日本語読みを構成する文字列の全ての組合せの部分文字列間について、上記記憶手段で記憶した対応付けを接続コストM(M≧0)、上記記憶手段で記憶していない対応付けを接続コストN(N>M)とした要素間距離の計算を行う要素間距離計算手段と、該要素間距離計算手段で計算した部分文字列間の要素間距離の語頭から語尾までの総和が最少になる対応付けを求める対応付け探索手段とを有することを特徴とするアルファベット文字・日本語読み対応付け装置。
IPC (3件):
G06F 17/22 ,  G06F 17/21 ,  G10L 13/00
FI (3件):
G06F 15/20 528 Z ,  G06F 15/20 568 Z ,  G10L 3/00 E
Fターム (3件):
5B009MJ05 ,  5B009RD00 ,  5D045AA20

前のページに戻る