Pat
J-GLOBAL ID:200903004665625606
用語辞書生成方法、用語辞書生成装置、プログラム、および記録媒体
Inventor:
,
,
,
,
Applicant, Patent owner:
Agent (1):
秋田 収喜
Gazette classification:公開公報
Application number (International application number):2007298022
Publication number (International publication number):2009123067
Application date: Nov. 16, 2007
Publication date: Jun. 04, 2009
Summary:
【課題】用語辞書作成者の負荷を増大させることなく、用語辞書を作成すること。【解決手段】文書に記載された文章中に含まれる用語の辞書を生成する用語辞書生成方法であって、文書に含まれるテキスト情報から名詞句を抽出するステップ502と、前記抽出した名詞句が、辞書データベースに格納済みか否かを判断するステップ504と、前記抽出した名詞句が前述辞書データベースに格納済みの名詞句の場合に、前記抽出した名詞句の出現頻度に1を加算するステップ506と、前記抽出した名詞句が前記辞書データベースに格納されていない未知の名詞句である場合に、前記未知の名詞句を抽出元の文書の属性情報とともに前記辞書データベースに格納するステップ505と、前記辞書データベースに格納済みの名詞句と関連する他文書の属性情報を前記辞書データベースに格納するステップ507と有する。【選択図】図5
Claim 1:
文書中に含まれる用語辞書を生成する用語辞書生成方法であって、
文書に含まれるテキスト情報から名詞句を抽出するステップ1と、
前記ステップ1で抽出した名詞句が、辞書データベースに格納済みか否かを判断するステップ2と、
前記ステップ2で判断した結果、前記ステップ1で抽出した名詞句が前記辞書データベースに格納済みの名詞句の場合に、前記抽出した名詞句の出現頻度に1を加算するステップ3と、
前記ステップ2で判断した結果、前記ステップ1で抽出した名詞句が前記辞書データベースに格納されていない名詞句である場合に、前記抽出した名詞句を抽出元の文書の属性情報とともに前記辞書データベースに格納するステップ4と、
前記辞書データベースに格納済みの名詞句と関連する他文書の属性情報を前記辞書データベースに格納するステップ5とを有することを特徴とする用語辞書生成方法。
IPC (3):
G06F 17/22
, G06F 17/28
, G06F 17/21
FI (3):
G06F17/22 522L
, G06F17/28 U
, G06F17/21 550A
F-Term (14):
5B009ME21
, 5B009MF03
, 5B009QA02
, 5B009QA03
, 5B091AA15
, 5B091AB17
, 5B091CC04
, 5B091CC16
, 5B091CD03
, 5B091DA12
, 5B109ME21
, 5B109MF03
, 5B109QA02
, 5B109QA03
Patent cited by the Patent:
Cited by applicant (1)
-
用語辞書管理装置
Gazette classification:公開公報
Application number:特願平9-054426
Applicant:株式会社日立製作所
Return to Previous Page