特許
J-GLOBAL ID:200903099966192331

多言語情報検索方法およびシステム

発明者:
出願人/特許権者:
代理人 (1件): 中村 稔 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-357349
公開番号(公開出願番号):特開平11-250105
出願日: 1998年12月16日
公開日(公表日): 1999年09月17日
要約:
【要約】【課題】 目標言語L2で書かれ、テキストデータベースに格納された関連ドキュメントを別の言語L1でアクセスできるようにする。【解決手段】 プロセッサ234 とメモリ236 と通信装置221 を備えた情報処理システム222 において実施する方法であって、(a)第1言語のユーザーが定義したテキスト部分を取り出し、(b)テキスト部分をトークン化して、トークン化したテキスト部分を生成し、(c)トークン化したテキスト部分を品詞明確化して、少なくとも1つの品詞インジケータがワードに付加された明確化テキスト部分を生成し、(d)明確化したテキスト部分をレマタイズして、明確化したテキスト部分の各ワードごとに、そのワードか若しくはレマ(見出し語)が得られればそのレマのどちらかを生成し、(e)レマが決定されたテキスト部分を翻訳して、各ワードごとに、少なくとも1つの訳語(各訳語はそのワードの第2言語L2への可能な翻訳である)を生成し、(f)第2言語L2の情報を検索するのに適した問合せを定義するため訳語をフォーマットする。
請求項(抜粋):
ネットワークとの間で通信を行うように、プロセッサとメモリと通信装置とを有する情報処理システムにおいて実施される方法であって、(a)第1テキスト部分を取り出すステップであって、該第1テキスト部分は第1言語L1内に複数のワードを有する、第1テキスト取り出しステップと、(b)前記第1テキスト部分をトークン化して、トークン化したフォーム内に第2テキスト部分を生成するステップと、(c)前記第2テキスト部分を品詞明確化して、第3テキスト部分を生成するステップであって、該第3テキスト部分は、前記第2テキスト部分の各ワードごとに、少なくとも1つの品詞インジケータが付加されているワードを有する、第3テキスト生成ステップと、(d)前記第3テキスト部分をレマタイズして、第4テキスト部分を生成するステップであって、該第4テキスト部分は、前記第3テキスト部分の各ワードごとに、当該ワード若しくは当該ワードに対応する見出し語(レマ)を得られる場合はその見出し語を有する、第4テキスト生成ステップと、(e)前記第4テキスト部分を翻訳して、第5テキスト部分を生成するステップであって、該第5テキスト部分は、前記第4テキスト部分の各ワードごとに、少なくとも1つの翻訳ワードを有しており、各翻訳ワードは当該ワードの第2言語L2への可能な翻訳である、第5テキスト生成ステップと、(f)前記第5テキスト部分をフォーマッティングして、第6テキスト部分を生成するステップであって、該第6テキスト部分は、前記翻訳ワードを組み入れて且つ前記第2言語L2の情報を検索するのに適した問合せを定義している、第6テキスト生成ステップとから成ることを特徴とする方法。
IPC (2件):
G06F 17/30 ,  G06F 17/28
FI (3件):
G06F 15/403 330 B ,  G06F 15/38 X ,  G06F 15/40 370 A
引用特許:
審査官引用 (1件)

前のページに戻る