特許
J-GLOBAL ID:200903008741147951
単語分割で使用される新単語収集方法およびシステム
発明者:
出願人/特許権者:
代理人 (2件):
谷 義一
, 阿部 和夫
公報種別:公開公報
出願番号(国際出願番号):特願2005-058934
公開番号(公開出願番号):特開2005-251206
出願日: 2005年03月03日
公開日(公表日): 2005年09月15日
要約:
【課題】 膠着言語のレキシコンに加える新しい単語を収集する方法、コンピュータ可読媒体、およびシステムを提供すること。【解決手段】 この方法では、検索エンジンに提出されたクエリのログが取得される。このクエリのログを分類して、分類されたクエリを得る。次いで、複数のヒューリスティックな基準を使用して、分類されたクエリをフィルタリングして新しい単語の候補リストを得る。そして、新しい単語の候補リストの単語がレキシコンに加えられる。【選択図】 図2
請求項(抜粋):
膠着言語のためのレキシコンに追加する新しい単語を収集する方法であって、
検索エンジンに提出されたクエリのログを取得するステップと、
前記クエリのログを分類して、分類されたクエリを得るステップと、
前記分類されたクエリを、複数のヒューリスティック基準を使用してフィルタリングして新しい単語の候補リストを得るステップと、
前記新しい単語の候補リストの単語をレキシコンに追加するステップと
を備えることを特徴とする方法。
IPC (2件):
FI (3件):
G06F17/30 210A
, G06F17/30 170A
, G06F17/28 X
Fターム (7件):
5B075ND03
, 5B075NK02
, 5B091AA15
, 5B091AB11
, 5B091CA02
, 5B091CC16
, 5B091DA12
引用特許:
審査官引用 (4件)
-
文書検索装置
公報種別:公開公報
出願番号:特願平8-012330
出願人:富士ゼロックス株式会社
-
特開平4-222055
-
特開平4-340163
-
情報抽出装置
公報種別:公開公報
出願番号:特願平10-073684
出願人:沖電気工業株式会社
全件表示
前のページに戻る