特許
J-GLOBAL ID:200903011655407585
日本語などの複雑言語のコンテンツを検索するシステム及び方法
発明者:
,
,
出願人/特許権者:
代理人 (1件):
特許業務法人快友国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2005-172147
公開番号(公開出願番号):特開2006-004427
出願日: 2005年06月13日
公開日(公表日): 2006年01月05日
要約:
【課題】日本語のような複雑言語の正字法のあいまい性除去と正字法間の検索のための方法とシステムを提供する。【解決手段】例えば一般的の主要な表現形式、異表記、代替の文法表現形式、発音異表記、固有名詞の異表記、数字異表記、学名、文化のふさわしさなどに関する一つ以上の規則を適用してそれぞれの概念を少なくとも一つのキーワード(同義語と異表記を更に加えて)に対応付けても良い。その後、語彙知識ベースの内容は、検索クエリーを実行するために使われる。ユーザーは検索クエリーの分割やその他の動作を補助する様々なストップワードとともに検索クエリー、その中のキーワード(又はそのキーワードに関連する同義語)は認識可能である、を入力してもよい。検索クエリーの実行は、資産の一覧又は類似の指示が返され、それは検索クエリー内で識別された概念に関係する。【選択図】図1
請求項(抜粋):
日本語に関する一つ以上の書記法または正字法表現形式を含んでいるテキストベースのクエリーを用いて要求されたコンテンツを検索するシステムであり、そのシステムは:
一つ以上の書記法または正字法表現形式に対応付けられた語彙情報を記憶する階層的に構造化された語彙知識ベースと、その知識ベースは:
識別子を意味概念に割り当てること;
意味概念に対する主要な正字法表現形式を識別すること、その主要な正字法表現形式は、漢字書記法、片仮名書記法、平仮名書記法、または漢字書記法と片仮名書記法と平仮名書記法の任意の組み合わせに基づいており;
少なくとも一つ以上の書記法または正字法表現形式に対して、少なくとも一つの同義的な正字法表現形式をその意味概念に対応付けること、その同義的な正字法表現形式は少なくとも部分的にはその主要な正字法表現形式とは異なっており、またその少なくとも一つの同義的な正字法表現形式は、漢字書記法、片仮名書記法、平仮名書記法、送り仮名異表記、ローマ字文語体表現形式、漢字書記法と片仮名書記法と平仮名書記法と送り仮名異表記とローマ字文語体表現形式の一つ以上に対応付けられた発音異表記、および/または、漢字書記法と片仮名書記法と平仮名書記法と送り仮名異表記とローマ字文語体表現形式の一つ以上に対応付けられた複合異表記、を一つ以上含んでおり;
その識別子、その主要な正字法表現形式、および少なくとも一つの同義的な正字法表現形式をそのシステムに対応付けられたデータ記憶部に記憶すること;および
付加的な意味概念に対して、前記割り当てること、前記識別すること、前記対応付けること、および前記記憶すること、を繰り返すこと、
を有する方法によって生成されており;
検索可能な資産に対応付けられた情報を記憶する資産保存部と;
その検索可能な資産とその語彙情報の間での照合を補助するための、資産保存部内の検索可能な資産を分類する分類部と、その照合は、少なくとも部分的には、その語彙知識ベース内に含まれる意味概念に割り当てられた識別子に基づいており;および、
その検索可能な資産に対してクエリーを受信および実行する検索エンジンと、
を有する。
IPC (1件):
FI (3件):
G06F17/30 330C
, G06F17/30 170A
, G06F17/30 320D
Fターム (9件):
5B075ND03
, 5B075NK32
, 5B075NK35
, 5B075PP24
, 5B075QP01
, 5B075QP03
, 5B075QT00
, 5B075UU02
, 5B075UU06
引用特許:
引用文献:
前のページに戻る