Pat
J-GLOBAL ID:200903039674363841
コミュニティ特有表現検出装置及び方法
Inventor:
Applicant, Patent owner:
Agent (1):
特許業務法人アイ・ピー・エス
Gazette classification:再公表公報
Application number (International application number):JP2006314000
Publication number (International publication number):WO2007010836
Application date: Jul. 13, 2006
Publication date: Jan. 25, 2007
Summary:
コミュニティ固有表現の収集に関係する従来技術では、専門的分野における名詞・複合名詞からなる専門用語の収集に関するものがあるが、名詞以外の新しい表現には応用が難しい。また、未知語・新語の収集の分野においても、対象はほぼ名詞に限定されて、新しい表現を規則的に収集するという手法は提案されていない。 所定のコミュニティで使用される文書集合の中から、(a)コミュニティに固有のnグラム連語を抽出する手段、(b)固有の表現の核となる可能性のある語基を選択する手段、(c)前記選択された語基をその前後に拡張する手段、(d)前記拡張された語基を文法に従って選別する手段によって、上記問題を解決している。
Claim (excerpt):
以下の(a)から(d)の手段を有する、所定のコミュニティで使用される文書集合から前記所定のコミュニティに特有な表現を検索する装置、
(a)前記コミュニティに特有に使用されるnグラム連語を抽出する手段、
(b)前記特有な表現の核となる可能性のある第一の語基を選択する手段、
(c)前記第一の語基の有意度、及び、前記第一の語基の前又は後の要素を取込んだ第二の語基の有意度を用いて算出された値に基づいて拡張語基を選択する手段、
(d)前記拡張語基の中から当該言語の語形成規則に従って前記所定のコミュニティに特有な表現を選別する手段。
IPC (2):
FI (3):
G06F17/28 U
, G06F17/30 220Z
, G06F17/28 C
F-Term (5):
5B075ND02
, 5B075NK32
, 5B091AA11
, 5B091AB08
, 5B091CA26
Patent cited by the Patent:
Cited by applicant (4)
-
未知語収集方法
Gazette classification:公開公報
Application number:特願2001-100238
Applicant:株式会社リコー
-
辞書データ収集装置
Gazette classification:公開公報
Application number:特願平3-172294
Applicant:沖電気工業株式会社
-
未知語登録装置および方法並びに記録媒体
Gazette classification:公開公報
Application number:特願2004-132643
Applicant:エー・アイ・ソフト株式会社
Return to Previous Page