特許
J-GLOBAL ID:200903036558793481

規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定

発明者:
出願人/特許権者:
代理人 (6件): 青木 篤 ,  鶴田 準一 ,  島田 哲郎 ,  河野 努 ,  下道 晶久 ,  西山 雅也
公報種別:公表公報
出願番号(国際出願番号):特願2004-546223
公開番号(公開出願番号):特表2006-504173
出願日: 2003年07月21日
公開日(公表日): 2006年02月02日
要約:
文書テキストから言語を同定する方法であって、ニューラル・ネットワーク(20)に基づく言語同定システムを利用して、アルファベット文字からなる文字列の言語を複数の言語間で同定する。NN-LID(20)システムが、アルファベット文字からなる標準アルファベットセット(22)を用いて、アルファベット文字からなるマップ済み文字列(10)に上記文字列をマップして、上記標準アルファベットセット(22)に基づいて、上記マップ済み文字列が言語のうちの1つとなる尤度を決定できるようにする。標準アルファベットセットの文字は言語依存型のアルファベット文字セットから選択される。スコアリングシステム(30)も利用して、上記言語依存型セットに基づいて、上記文字列が各言語の文字列となる尤度を決定する。
請求項(抜粋):
言語自動同定システムに基づいてアルファベット文字からなる文字列の言語を複数の言語の中で同定する方法であって、前記複数の言語の個々の言語がアルファベット文字の個別セットを有する方法において、 アルファベット文字からなる参照セットから選択したマップ済みアルファベット文字の文字列に、アルファベット文字からなる前記文字列をマップするステップと、 アルファベット文字からなる前記マップ済み文字列が前記複数の言語のうちの各言語の文字列となる確率を示す第1の値を取得するステップと、 各個別セットにおいて前記文字列内の前記アルファベット文字の一致を示す第2の値を取得するステップと、 前記第1の値と前記第2の値とに基づいて前記文字列の言語を決定するステップと、を具備することを特徴とする方法。
IPC (3件):
G06F 17/21 ,  G06F 17/27 ,  G06F 17/30
FI (4件):
G06F17/21 550A ,  G06F17/21 592A ,  G06F17/27 D ,  G06F17/30 210D
Fターム (13件):
5B009ME24 ,  5B009QA01 ,  5B009VB01 ,  5B075ND03 ,  5B075NR20 ,  5B075QT04 ,  5B075UU06 ,  5B075UU09 ,  5B091AA01 ,  5B091AA15 ,  5B091CD08 ,  5B091EA02 ,  5B091EA24
引用特許:
審査官引用 (9件)
全件表示

前のページに戻る