特許
J-GLOBAL ID:201703018336664190
ターゲット文書を読取るためのエンコーディングフォーマットを選択する方法及びシステム
発明者:
,
,
,
出願人/特許権者:
,
,
代理人 (4件):
青木 篤
, 鶴田 準一
, 南山 知広
, 榎原 正巳
公報種別:公表公報
出願番号(国際出願番号):特願2016-517326
公開番号(公開出願番号):特表2016-540269
出願日: 2013年12月06日
公開日(公表日): 2016年12月22日
要約:
本発明は、ターゲット文書を読取るべく使用されるエンコーディングフォーマットを選択する方法及びシステムを提供する。方法は、少なくとも一つの基準エンコーディングフォーマットによって基準文書を読取り、且つ、基準エンコーディングフォーマットによって基準文書を読取った際に取得されるすべて又はいくつかの障害コードパターンを判定することと、毎回、一つのエンコーディングフォーマットによってターゲット文書を読取ることと、それぞれのエンコーディングフォーマットごとに、このエンコーディングフォーマットによってターゲット文書を読取った際に生成されるデータと判定された障害コードパターンとを比較し、このエンコーディングフォーマットによってターゲット文書を読取った際に生成される障害コードを判定することと、それぞれのエンコーディングフォーマットによってターゲット文書を読取った際に生成される障害コードをカウントし、且つ、比較を実行してターゲット文書を読取るべく使用されるエンコーディングフォーマットを判定することと、を具備する。上述の技術的解決策は、従来技術における問題を、即ち、テキスト文書内の最初のいくつかのバイトのみを読出すことにより、これらのバイトの値を判定し、且つ、これにより、そのエンコーディングフォーマットを判定しているが、いくつかのケースにおいては、これらのバイト内において保持されたテキスト文書のエンコーディングフォーマットに関する情報が存在しておらず、従って、このような方式によってテキスト文書のエンコーディングフォーマットを取得することが不可能であるということを、回避し得る。
請求項(抜粋):
ターゲット文書を読取るべく使用されるエンコーディングフォーマットを選択する方法であって、
少なくとも一つの基準エンコーディングフォーマットによって基準文書を読取り、且つ、該基準エンコーディングフォーマットによって該基準文書を読取った際に取得されるすべて又はいくつかの障害コードパターンを判定することと、
毎回、一つのエンコーディングフォーマットによって該ターゲット文書を読取ることと、
それぞれのエンコーディングフォーマットごとに、このエンコーディングフォーマットによって該ターゲット文書を読取った際に生成されるデータと該判定された障害コードパターンとを比較し、このエンコーディングフォーマットによって該ターゲット文書を読取った際に生成される障害コードを判定することと、
それぞれのエンコーディングフォーマットによって該ターゲット文書を読取った際に生成される障害コードをカウントし、且つ、該ターゲット文書を読取るべく使用される該エンコーディングフォーマットを判定するための比較を実行することと、
を具備することを特徴とする方法。
IPC (1件):
FI (1件):
Fターム (1件):
引用特許: