特許
J-GLOBAL ID:200903008770343387
機械翻訳用のシーケンス分類
発明者:
,
,
出願人/特許権者:
代理人 (8件):
岡部 正夫
, 加藤 伸晃
, 岡部 讓
, 臼井 伸一
, 越智 隆夫
, 朝日 伸光
, 三山 勝巳
, 鳥居 健一
公報種別:公開公報
出願番号(国際出願番号):特願2007-331748
公開番号(公開出願番号):特開2008-165786
出願日: 2007年12月25日
公開日(公表日): 2008年07月17日
要約:
【課題】ある記号のシーケンスを記号の別のシーケンスに翻訳するのに適用可能な方法及びモデルを提供する。【解決手段】自然言語文の翻訳など、シーケンスの分類が、独立仮定を使用して実行される。独立仮定とは、特定のターゲット文単語へのソース文単語の正しい翻訳の確率が、文内の他の単語の翻訳と独立であるという仮定である。この仮定は、正しい仮定ではないが、それでも、高いレベルの単語翻訳精度が達成される。具体的に言うと、識別トレーニングが、トレーニング文内の対応するソース単語の特徴の集合に基づいて、ターゲット語彙単語ごとのモデルを展開するのに使用され、これらの特徴のうちの少なくとも1つは、ソース単語の文脈に関連する。各モデルは、対応するターゲット語彙単語の重みベクトルを含む。ベクトルを構成する重みは、特徴のめいめいの1つに関連し、各重みは、ソース単語のその特徴の存在が、問題のターゲット単語が正しい単語である可能性をより高める範囲の尺度である。【選択図】図2
請求項(抜粋):
ソース記号シーケンスをターゲット記号シーケンスに分類する方法であって、
ソース・シーケンスの各記号を前記ソース・シーケンスの他の記号と独立に分類するステップであって、前記分類は記号モデルに基づき、前記記号モデルのうちの少なくとも1つの各々はトレーニング・シーケンス文脈情報の関数である、ステップと、
前記独立に分類されたソース・シーケンス記号に基づいて前記ターゲット記号シーケンスを分類するステップと
を含む方法。
IPC (1件):
FI (1件):
Fターム (8件):
5B091AA04
, 5B091BA03
, 5B091BA11
, 5B091CA12
, 5B091CC01
, 5B091EA01
, 5B091EA02
, 5B091EA25
引用特許:
出願人引用 (1件)
-
米国特許出願第11/___,___号、名称「Discriminative Training Of Models For Sequence Classification」
前のページに戻る