特許
J-GLOBAL ID:200903015186756528

複数文字列アライメント方法およびシステム

発明者:
出願人/特許権者:
代理人 (1件): 加藤 朝道
公報種別:公開公報
出願番号(国際出願番号):特願平10-116084
公開番号(公開出願番号):特開平11-296553
出願日: 1998年04月10日
公開日(公表日): 1999年10月29日
要約:
【要約】【課題】複数の文字列に対し、各文字列内の文字間に空白を挿入し長さを同じにする際に、空白挿入後の各位置での文字をなるべく合致させる、複数文字列のアライメントを効率よく、且つ高精度に実現する方法及びシステムの提供。【解決手段】学習部101は、文字列データから文字列に空白(ヌル文字)を挿入後の各文字位置iにおける(ヌル文字を含む)文字種類jの確率分布p(i,j)の初期値、及び文字データを入力する。学習部101は、文字間の類似度をも使用して、p(i,j)の大域的に最適な値を学習可能であり、学習の結果得られた、p(i,j)を書き換える。推定部102は、学習された確率分布p(i,j)と文字列データを入力とし、文字列に対し最尤値を与えるヌル文字挿入位置を推定し、最尤値に対応する文字位置とヌル文字位置をアライメント結果として出力する。
請求項(抜粋):
所与の複数の文字列に対し、各文字列内の文字間に空白を挿入し長さを同じにする際に、空白挿入後の各位置での文字をなるべく合致させる、複数文字列のアライメント方法において、前記位置毎に文字及び空白の確率分布を持つ確率モデルを使用し、前記所与の複数の文字列から前記確率分布を学習し、前記所与の各文字列に対する最適な空白挿入位置を前記確率分布から推定する、ことを特徴とする複数文字列アライメント方法。
IPC (2件):
G06F 17/30 ,  G06F 17/60
FI (2件):
G06F 15/40 370 F ,  G06F 15/21 Z
引用特許:
出願人引用 (3件) 審査官引用 (1件)

前のページに戻る