Pat
J-GLOBAL ID:200903036558793481

規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定

Inventor:
Applicant, Patent owner:
Agent (6): 青木 篤 ,  鶴田 準一 ,  島田 哲郎 ,  河野 努 ,  下道 晶久 ,  西山 雅也
Gazette classification:公表公報
Application number (International application number):2004546223
Publication number (International publication number):2006504173
Application date: Jul. 21, 2003
Publication date: Feb. 02, 2006
Summary:
文書テキストから言語を同定する方法であって、ニューラル・ネットワーク(20)に基づく言語同定システムを利用して、アルファベット文字からなる文字列の言語を複数の言語間で同定する。NN-LID(20)システムが、アルファベット文字からなる標準アルファベットセット(22)を用いて、アルファベット文字からなるマップ済み文字列(10)に上記文字列をマップして、上記標準アルファベットセット(22)に基づいて、上記マップ済み文字列が言語のうちの1つとなる尤度を決定できるようにする。標準アルファベットセットの文字は言語依存型のアルファベット文字セットから選択される。スコアリングシステム(30)も利用して、上記言語依存型セットに基づいて、上記文字列が各言語の文字列となる尤度を決定する。
Claim (excerpt):
言語自動同定システムに基づいてアルファベット文字からなる文字列の言語を複数の言語の中で同定する方法であって、前記複数の言語の個々の言語がアルファベット文字の個別セットを有する方法において、 アルファベット文字からなる参照セットから選択したマップ済みアルファベット文字の文字列に、アルファベット文字からなる前記文字列をマップするステップと、 アルファベット文字からなる前記マップ済み文字列が前記複数の言語のうちの各言語の文字列となる確率を示す第1の値を取得するステップと、 各個別セットにおいて前記文字列内の前記アルファベット文字の一致を示す第2の値を取得するステップと、 前記第1の値と前記第2の値とに基づいて前記文字列の言語を決定するステップと、を具備することを特徴とする方法。
IPC (3):
G06F 17/21 ,  G06F 17/27 ,  G06F 17/30
FI (4):
G06F17/21 550A ,  G06F17/21 592A ,  G06F17/27 D ,  G06F17/30 210D
F-Term (13):
5B009ME24 ,  5B009QA01 ,  5B009VB01 ,  5B075ND03 ,  5B075NR20 ,  5B075QT04 ,  5B075UU06 ,  5B075UU09 ,  5B091AA01 ,  5B091AA15 ,  5B091CD08 ,  5B091EA02 ,  5B091EA24
Patent cited by the Patent:
Cited by examiner (9)
Show all

Return to Previous Page