特許
J-GLOBAL ID:201403052197594751
特徴語抽出装置、プログラム及び方法
発明者:
,
出願人/特許権者:
代理人 (1件):
原田 一男
公報種別:特許公報
出願番号(国際出願番号):特願2011-007354
公開番号(公開出願番号):特開2012-150576
特許番号:特許第5516434号
出願日: 2011年01月17日
公開日(公表日): 2012年08月09日
請求項(抜粋):
【請求項1】 複数の文書のデータが格納されている文書格納部と、
前記文書格納部に格納されている複数の文書のデータのうち第1の文書のデータにおける文節の各々を、区切り位置及び区切りの数を変化させつつ分割し、当該分割により得られた文字列を第1データ格納部に格納する文字列生成部と、
前記第1データ格納部に格納されている文字列の各々について、当該文字列が前記第1の文書のデータに出現する回数と前記文書格納部に格納されている複数の文書のデータのうち当該文字列が出現する文書のデータの件数とを用いて、前記第1の文書の特徴を表す語としての相応しさを表す特徴度を算出し、当該文字列と当該文字列の特徴度とを対応付けて第2データ格納部に格納する算出部と、
前記第1の文書のデータにおける文節の各々について、当該文節についての文字列のうち特徴度が最も高い文字列である第1の文字列を前記第2データ格納部から特定し、特定された第1の文字列を特徴語格納部に格納する特定部と
を有する特徴語抽出装置。
IPC (2件):
G06F 17/30 ( 200 6.01)
, G06F 17/27 ( 200 6.01)
FI (3件):
G06F 17/30 210 A
, G06F 17/30 170 A
, G06F 17/27 Z
前のページに戻る