Pat
J-GLOBAL ID:200903017027992019

データ表示テキストの言語および文字セットの特定

Inventor:
Applicant, Patent owner:
Agent (1): 谷 義一 (外2名)
Gazette classification:公表公報
Application number (International application number):2000524742
Publication number (International publication number):2001526425
Application date: Dec. 04, 1998
Publication date: Dec. 18, 2001
Summary:
【要約】本発明は、特定のデータ値と共に文字の形に関連する文字セットに従って、一連のデータ値によって表示されるテキストの未知の言語を特定するための機能を提供する。最初に当該機能は、一連のデータ値の上で特定のデータ値の発生の観点から一連のデータ値を特徴付ける特徴付けを生成する。複数の言語の各々に対して、当該機能は、その言語におけるテキストの代表サンプルにおける特定のデータ値の統計的な発生の観点から言語をモデル化するモデルを検索する。当該機能は、検索されたモデルを一連のデータ値の生成された特徴付けと比較し、区別された言語として、モデルが一連のデータ値の生成された特徴付けと最も好ましく比較を行う言語を特定する。
Claim (excerpt):
文字の形と特定のデータ値とを結びつけた未知の区別された文字セットに従って未知の区別された言語でテキストを表示する一連のデータ値に対して、前記一連のデータ値を使用して前記区別された言語を特定するためのコンピュータシステムにおける方法において、 前記一連のデータ値を特徴付ける特徴付けを生成するステップと、 各々の複数の言語に対して、 前記言語のテキストの表示サンプルにおける特定のデータ値の統計的な発生の観点から前記言語をモデル化するモデルを検索するステップと、 前記検索されたモデルを前記一連のデータ値の特徴付けと比較するステップと、 モデルが一連のデータ値の特徴付けと最も好ましく比較を行う複数の言語の中の前記言語を前記区別された言語として特定するステップと を備えることを特徴とする方法。
F-Term (4):
5B091AA15 ,  5B091CB01 ,  5B091EA00 ,  5B091EA01
Patent cited by the Patent:
Cited by examiner (1)

Return to Previous Page