特許
J-GLOBAL ID:200903023650458120

異表記正規化処理装置、異表記正規化処理プログラム、これを記憶する記憶媒体、文書検索装置、文書検索プログラム及びこれを記憶する記憶媒体

発明者:
出願人/特許権者:
代理人 (3件): 柏木 慎史 ,  小山 尚人 ,  柏木 明
公報種別:公開公報
出願番号(国際出願番号):特願2003-169484
公開番号(公開出願番号):特開2005-004626
出願日: 2003年06月13日
公開日(公表日): 2005年01月06日
要約:
【課題】漢字表記が異なる各種の言語間における多様な表記のゆれを吸収することができる異表記正規化処理装置を提供する。【解決手段】入力テキストを受け付ける文書入力手段101と、この文書入力手段101により受け付けた入力テキストから漢字表記を抽出する漢字相当切出手段102aと、漢字表記が異なる言語間の文字対応を記述した少なくとも2種以上の異表記正規化規則102cと、文書入力手段101により受け付けた入力テキストに適した異表記正規化規則102cを選択する異表記正規化規則選択手段102dと、この異表記正規化規則選択手段102dにより選択した異表記正規化規則102cに応じて漢字相当切出手段102aにより抽出した漢字表記を正規化する正規化処理手段102bと、を備える。これにより、漢字表記が異なる各種の言語間における多様な表記のゆれを吸収することができる。【選択図】 図2
請求項(抜粋):
入力テキストを受け付ける文書入力手段と、 この文書入力手段により受け付けた前記入力テキストから漢字表記を抽出する漢字相当切出手段と、 漢字表記が異なる言語間の文字対応を記述した少なくとも2種以上の異表記正規化規則を格納する正規化規則格納手段と、 前記文書入力手段により受け付けた前記入力テキストに適した前記異表記正規化規則を選択する異表記正規化規則選択手段と、 この異表記正規化規則選択手段により選択した前記異表記正規化規則に応じて前記漢字相当切出手段により抽出した漢字表記を正規化する正規化処理手段と、を備える異表記正規化処理装置。
IPC (4件):
G06F17/30 ,  G06F12/00 ,  G06F17/21 ,  G06K9/00
FI (7件):
G06F17/30 230Z ,  G06F17/30 170A ,  G06F17/30 320D ,  G06F12/00 513D ,  G06F17/21 550K ,  G06F17/21 592A ,  G06K9/00 S
Fターム (16件):
5B009QA12 ,  5B009QA15 ,  5B009QA16 ,  5B009SA12 ,  5B009VA02 ,  5B009VB01 ,  5B064AA07 ,  5B064AB16 ,  5B064CA08 ,  5B064EA19 ,  5B064FA02 ,  5B064FA12 ,  5B075ND03 ,  5B075NK02 ,  5B075NK35 ,  5B082GA08
引用特許:
審査官引用 (2件)
引用文献:
審査官引用 (2件)

前のページに戻る