特許
J-GLOBAL ID:200903014060542771

文字符号化の自動検出

発明者:
出願人/特許権者:
代理人 (2件): 中島 淳 ,  加藤 和詳
公報種別:公開公報
出願番号(国際出願番号):特願2006-209344
公開番号(公開出願番号):特開2007-048284
出願日: 2006年08月01日
公開日(公表日): 2007年02月22日
要約:
【課題】電子文書中で文字符号化を検出するシステム及び方法を提供する。【解決手段】電子文書が適法な数値コードを有するテキスト文字列だけを含むかどうかを判断するためにテキスト文字列を試験し、適法にコード化されたマッピングの候補を提供するためにテキスト文字列の統計的な分析を実施し、適法にコード化された候補をランク付けし、適法にコード化された候補のランク付けを適法にコード化された候補の予想ランク付けと結合し、最も確かそうな文字マッピングを実現する。【選択図】図1
請求項(抜粋):
複数のテキスト文字列を含む電子文書中で活用される符号化を検出する方法であって、符号化された文書の該テキスト文字列は複数の適法な数値コードのうちの一つと関連付けられ、 該電子文書が適法な数値コードを有するテキスト文字列だけを含むかどうかを判断するためにテキスト文字列を試験することと、 適法にコード化されたマッピングの候補を提供するために該テキスト文字列の統計的な分析を実施することと、 該適法にコード化された候補をランク付けすることと、 該適法にコード化された候補のランク付けを適法にコード化された候補の予想ランク付けと結合し、最も確かそうな文字マッピングを実現することと、 を備える方法。
IPC (1件):
G06F 17/21
FI (1件):
G06F17/21 570L
Fターム (1件):
5B009TA11
引用文献:
審査官引用 (7件)
  • A composite approach to language/encoding detection
  • A composite approach to language/encoding detection
  • A composite approach to language/encoding detection
全件表示

前のページに戻る