特許
J-GLOBAL ID:200903093627967121
話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2003-357372
公開番号(公開出願番号):特開2005-122510
出願日: 2003年10月17日
公開日(公表日): 2005年05月12日
要約:
【課題】 複数の話題を検出して話題間の関係と各話題の要約文を自動生成する。【解決手段】 本発明は、テキストを単語単位に分割し、概念ベースを検索することによって、各単語に対応するベクトルを取得し、単語ベクトルの系列からテキストを同一話題の区間であるセグメントの集合へ分割し、セグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングし、得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出し、クラスタ間の関係と、各クラスタの要約文を出力する。【選択図】 図1
請求項(抜粋):
テキスト中の複数の話題を検出し、話題間の関係を抽出・可視化するための話題構造抽出装置が実行する話題構造抽出方法において、
形態素解析手段が、テキストを単語単位に分割する形態素解析過程と、
単語ベクトル取得手段が、単語の意味を表現するベクトルが格納されている記憶手段である概念ベースを検索することによって、前記形態素解析過程で得られた各単語に対応するベクトルを取得する単語ベクトル取得過程と、
トピックセグメンテーション手段が、前記単語ベクトル取得過程で得られた単語ベクトルの系列から、前記テキストを同一話題の区間であるセグメントの集合へ分割するトピックセグメンテーション過程と、
セグメントクラスタリング手段が、前記トピックセグメンテーション過程で得られたセグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングするセグメントクラスタリング過程と、
要約手段が、前記セグメントクラスタリング過程で得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出する要約過程と、
話題構造出力手段が、前記セグメントクラスタリング過程で得られたクラスタ間の関係と、前記要約過程で得られた各クラスタの要約文を出力する話題構造出力過程と、からなることを特徴とする話題構造抽出方法。
IPC (1件):
FI (3件):
G06F17/30 220A
, G06F17/30 170A
, G06F17/30 220Z
Fターム (3件):
5B075ND03
, 5B075NR12
, 5B075NS01
引用特許:
引用文献:
前のページに戻る