特許
J-GLOBAL ID:200903043518528242

テキストクラスタリング方法および音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 香山 秀幸
公報種別:公開公報
出願番号(国際出願番号):特願2002-275887
公開番号(公開出願番号):特開2004-109906
出願日: 2002年09月20日
公開日(公表日): 2004年04月08日
要約:
【課題】この発明は、単語共起情報に基づいてテキストコーパスをクラスタリングするテキストクラスタリング方法を提供することを目的とする。【解決手段】テキスト間の距離を尺度としてテキストコーパスをクラスタリングするテキストクラスタリング方法であって、テキスト間の距離を各テキストに含まれる各単語の単語共起情報に基づいて算出する。より具体的には、テキスト間の相対距離を尺度としたk-means 法により、クラスタリングを行う。ただし、k-means 法で必要な各クラスタの重心は、各テキストについてクラスタ内の自分以外のテキストとの距離の総和を求め、その総和距離が最小となるテキストとする。【選択図】 図3
請求項(抜粋):
テキスト間の距離を尺度としてテキストコーパスをクラスタリングするテキストクラスタリング方法であって、テキスト間の距離を各テキストに含まれる各単語の単語共起情報に基づいて算出することを特徴とするテキストクラスタリング方法。
IPC (2件):
G10L15/18 ,  G10L15/28
FI (2件):
G10L3/00 537G ,  G10L3/00 571C
Fターム (1件):
5D015BB01
引用特許:
審査官引用 (4件)
全件表示
引用文献:
前のページに戻る