Pat
J-GLOBAL ID:200903021089943542
2ヶ国語で書かれた単語アラインメントからの効率的なフレーズ対の抽出
Inventor:
,
Applicant, Patent owner:
Agent (2):
谷 義一
, 阿部 和夫
Gazette classification:公表公報
Application number (International application number):2009518107
Publication number (International publication number):2009543190
Application date: Apr. 30, 2007
Publication date: Dec. 03, 2009
Summary:
ソースセンテンスとターゲットセンテンスとの間でフレーズアラインメント対を識別する方法が提供される。ソースセンテンス内のフレーズの境界は、ソースフレーズの境界を形成するために、ソース単語がターゲットセンテンス内の少なくとも1つのターゲット単語と対応するということを要求することによって識別される。ターゲットセンテンス内のフレーズの境界は、ソースフレーズ内の単語とターゲットセンテンス内の単語との間のアラインメントに基づいて識別される。ターゲットフレーズ内の単語のいずれかがソースフレーズの外側にあるソース単語と対応しているか否かを判定するために、ターゲットフレーズ内の単語を調べる。ターゲットフレーズ内の単語がソースフレーズの外側にあるソース単語と対応していない場合、ソースフレーズ及びターゲットフレーズは、アラインメント対を形成すると判定されて、フレーズアラインメント対として記憶される。
Claim (excerpt):
ターゲットセンテンス内の少なくとも1つのターゲット単語とソース単語が対応することを要求することにより、ソースセンテンス内のフレーズに対する境界を識別して、ソースフレーズの境界を形成するステップ(302、312、322)と、
前記ソースフレーズ内の単語と前記ターゲットセンテンス内の単語との間のアラインメントに基づいて、前記ターゲットセンテンス内のフレーズに対する境界を識別するステップ(304、314)と、
前記ターゲットフレーズの単語のいずれかが前記ソースフレーズの外側にあるソース単語と対応しているか否かを判定することにより、前記ソースフレーズ及び前記ターゲットフレーズがフレーズアラインメント対を形成するか否かを判定するステップ(308、310)と、
前記ソースフレーズ及び前記ターゲットフレーズがフレーズアラインメント対を形成する場合に、前記ソースフレーズ及び前記ターゲットフレーズを記憶するステップ(318、500)と
を含むことを特徴とする方法。
IPC (1):
FI (1):
F-Term (5):
5B091AA03
, 5B091AA15
, 5B091BA03
, 5B091CA01
, 5B091CC16
Patent cited by the Patent:
Cited by applicant (1)
-
米国特許出願公開第2004-0044530A1号明細書
Return to Previous Page