Pat
J-GLOBAL ID:200903079528255010

言語を特定する方法およびシステム

Inventor:
Applicant, Patent owner:
Agent (1): 坂口 博 (外1名)
Gazette classification:公開公報
Application number (International application number):1997259483
Publication number (International publication number):1998124513
Application date: Sep. 25, 1997
Publication date: May. 15, 1998
Summary:
【要約】【課題】 文書が書かれている言語を複数の候補言語の各々におけるもっとも頻繁に使用される語のセットを使用することによって特定する。【解決手段】 もっとも頻繁に使用される語の各セットは、もっとも頻繁に使用される語の各セットにおける文字対にしたがって、それぞれの候補言語に対するワード・テーブルのそれぞれのセットに記憶される。好ましい実施の形態において、各ワード・テーブルはN×Nビットのテーブルであり、各ビットは候補言語の1つにおけるもっとも頻繁に使用される語の1つの特定の場所での所与の文字対を表している。文書からの語をワード・テーブルに記憶されているもっとも頻繁に使用されている語と比較する。文書からの語と、ワード・テーブルの各個別のセットに記憶されている語との間のマッチの数のカウントが、各個別の言語に対して維持される。文書の言語はマッチ数がもっとも大きいそれぞれの候補言語である。
Claim (excerpt):
複数の候補言語の各々においてもっとも頻繁に使用される語のセットを選択するステップと、もっとも頻繁に使用される語の各セットをもっとも頻繁に使用される語の各セットにおける文字対にしたがって、それぞれの候補言語に対するワード・テーブルのそれぞれのセットに記憶するステップと、文書からの語を前記ワード・テーブルに記憶されているもっとも頻繁に使用される語と比較するステップと、文書からの語と前記ワード・テーブルの各個別のセットに記憶されている語との間のマッチの数をカウントするステップと、文書の言語をマッチ数がもっとも大きいそれぞれの候補言語として特定するステップとを備えている文書が書かれている言語を特定する方法。

Return to Previous Page