特許
J-GLOBAL ID:200903001096923416

テキスト分析システム、テキスト分析方法、および、テキスト分析プログラム

発明者:
出願人/特許権者:
代理人 (3件): 机 昌彦 ,  木村 明隆 ,  浅井 俊雄
公報種別:公開公報
出願番号(国際出願番号):特願2009-100428
公開番号(公開出願番号):特開2009-176319
出願日: 2009年04月17日
公開日(公表日): 2009年08月06日
要約:
【課題】ユーザが注目している特定の概念を指定することで、その指定概念が含まれているか含まれていないかで表現を同一視するか区別するかを指定できるようにし、また、この概念の組を複数保持しておき、概念の組を変化させながら特長を分析することにより、助動詞など付属語による意味の違いによってテキストの特徴分析を可能にする。【解決手段】データ処理装置20の形態素解析手段21は、記憶装置30のテキストデータベース01のテキストを入力として、解析用辞書31に記憶された単語の見出しを元に、テキストを形態素に分割する。文節認定手段22は、形態素解析手段21が分割した形態素から、文節認定規則テーブル32に記憶されている規則に基づき、文節を認定する。データ分析手段29は、文節認定手段22で認定された大量の文節から特徴を分析する。【選択図】図1
請求項(抜粋):
電子情報である日本語テキストをテキスト分析するシステムであって 日本語テキストを形態素に分割する形態素解析手段と、 分割された形態素を文節にまとめる文節認定手段と、 前記文節認定手段で認定した文節に含まれる自立語であるヘッドワードとその文節に特定の概念を持つ形態素が含まれるか含まれないかを抽出する概念認定手段と、 前記概念認定手段で認定された文節のヘッドワードと特定の概念の有無を組として日本語テキストの統計分析を実施するデータ分析手段と を備えたことを特徴とするテキスト分析システム
IPC (2件):
G06F 17/27 ,  G06F 17/30
FI (3件):
G06F17/27 E ,  G06F17/30 170A ,  G06F17/30 220Z
Fターム (3件):
5B075ND03 ,  5B091AA15 ,  5B091CA02
引用特許:
出願人引用 (1件)
  • 特開平3-48367号公報

前のページに戻る