Pat
J-GLOBAL ID:201103003439266042
複合名詞抽出装置
Inventor:
,
,
,
,
,
,
Applicant, Patent owner:
Agent (5):
金山 聡
, 深町 圭子
, 伊藤 英生
, 藤枡 裕実
, 後藤 直樹
Gazette classification:公開公報
Application number (International application number):2009205518
Publication number (International publication number):2011059754
Application date: Sep. 07, 2009
Publication date: Mar. 24, 2011
Summary:
【課題】 事前に複合名詞リストや詳細なルールを記述することなく、適切な複合名詞を抽出することが可能な複合名詞抽出装置を提供する。【解決手段】 文書データを形態素解析した後、形態素の品詞情報で品詞結合規則を参照し、連続する形態素が結合規則に適合する場合に、その連続する形態素を複合名詞候補として、複合名詞候補データ150を得る。そして、複合名詞候補を構成する先頭の形態素、末尾の形態素それぞれについて、文字列頻度データを参照して先頭の形態素の前方スコア、末尾の形態素の後方スコアを取得し、両スコアがともにスコア設定値より大きい場合に、先頭の形態素から末尾の形態素までの文字列を複合名詞として抽出する。【選択図】 図8
Claim (excerpt):
文書データに対して形態素解析を実行し、形態素、および各形態素の品詞情報を含む形態素解析データを得る形態素解析手段と、
前記形態素解析データに含まれる形態素の品詞情報で、各品詞について結合するか否かを記録した品詞結合規則データを参照し、連続する形態素がいずれも結合するものである場合に、当該連続する形態素を複合名詞候補とする複合名詞候補作成手段と、
前記複合名詞候補を構成する先頭の形態素、末尾の形態素それぞれについて、文字列頻度データを参照し、先頭の形態素、末尾の形態素の出現頻度に基づくスコアを取得し、両スコアがともに所定の条件を満たす場合に、先頭の形態素から末尾の形態素までの文字列を複合名詞として抽出する複合名詞抽出手段と、
を有することを特徴とする複合名詞抽出装置。
IPC (2):
FI (2):
G06F17/27 E
, G06F17/30 210A
F-Term (4):
5B075ND03
, 5B075NK32
, 5B091AB11
, 5B091CA02
Article cited by the Patent:
Return to Previous Page