Pat
J-GLOBAL ID:200903095089021045

用語抽出装置と用語抽出方法及びそのプログラムを格納した記憶媒体

Inventor:
Applicant, Patent owner:
Agent (1): 小島 俊郎
Gazette classification:公開公報
Application number (International application number):2001147719
Publication number (International publication number):2002342321
Application date: May. 17, 2001
Publication date: Nov. 29, 2002
Summary:
【要約】【課題】文書あるいは文書集合中で特定の品詞や字種などの並びで頻出する文字列について辞書に未登録の用語として抽出するとともに正確な用語を抽出する。【解決手段】文書入力部2に入力した文書の形態素解析を形態素解析部3で行い、形態素解析結果中の特定の単語の並びを用語抽出部4で抽出し、同一対象文書あるいは同一対象文書集合中で同じ単語の並びが特定数以上出現したものを用語として抽出し、専門的な分野や特定の組織内でのみ使われる略称のように辞書に未登録の場合が多く、正しく解析できない用語を正確に抽出することができる。
Claim (excerpt):
文書入力部と形態素解析部及び用語抽出部を有し、文書入力部は文書を入力として受け付け、形態素解析部は入力した文書の形態素解析を行い、用語抽出部は形態素解析結果中の特定の単語の並びを抽出し、同一対象文書あるいは同一対象文書集合中で同じ単語の並びが特定数以上出現したものを用語として抽出することを特徴とする用語抽出装置。
IPC (3):
G06F 17/27 ,  G06F 17/30 170 ,  G06F 17/30 210
FI (3):
G06F 17/27 E ,  G06F 17/30 170 A ,  G06F 17/30 210 A
F-Term (7):
5B075ND03 ,  5B075PQ72 ,  5B075UU02 ,  5B091AA11 ,  5B091AB08 ,  5B091CA02 ,  5B091EA25
Patent cited by the Patent:
Cited by examiner (1)

Return to Previous Page