特許
J-GLOBAL ID:202003018099139722

分類方法、装置、及びプログラム

発明者:
出願人/特許権者:
代理人 (3件): 中島 淳 ,  加藤 和詳 ,  福田 浩志
公報種別:公開公報
出願番号(国際出願番号):特願2018-123998
公開番号(公開出願番号):特開2020-004157
出願日: 2018年06月29日
公開日(公表日): 2020年01月09日
要約:
【課題】テキストの分類精度を向上させる。【解決手段】受付解析部12が、受け付けた複数のテキストのうちの何れかのテキストについて、テキストに含まれる形態素と、形態素の属性情報との組をそれぞれが含む複数の解析結果情報を取得し、分割部14が、特定の形態素と、特定の形態素の属性情報とを含む形態素情報を記憶する記憶部を参照して、取得した複数の解析結果情報に、形態素情報に含まれる特定の形態素と、特定の形態素の属性情報との組が含まれるか否かの判定を行い、判定結果が肯定的である場合、何れかのテキストを、何れかのテキストにおける、何れかの解析結果情報に含まれる形態素の出現位置に応じた位置で分割して、複数のテキストを生成し、分類部16が、受け付けた複数のテキストのうちの他のテキストと、生成した複数のテキストと、を複数のクラスタに分類する。【選択図】図9
請求項(抜粋):
複数のテキストを受け付け、 受け付けた前記複数のテキストのうちの何れかのテキストについて、該テキストに含まれる形態素と、該形態素の属性情報との組をそれぞれが含む複数の解析結果情報を取得し、 特定の形態素と、該特定の形態素の属性情報とを含む形態素情報を記憶する記憶部を参照して、取得した前記複数の解析結果情報のうちの何れかの解析結果情報に、前記形態素情報に含まれる前記特定の形態素と、該特定の形態素の属性情報との組が含まれるか否かの判定を行い、 判定結果が肯定的である場合、前記何れかのテキストを、該何れかのテキストにおける、前記何れかの解析結果情報に含まれる形態素の出現位置に応じた位置で分割して、複数のテキストを生成し、 受け付けた前記複数のテキストのうちの他のテキストと、生成した前記複数のテキストと、を複数のクラスタに分類する、 処理をコンピュータが実行することを特徴とする分類方法。
IPC (3件):
G06F 16/00 ,  G06F 16/30 ,  G06F 40/131
FI (4件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 330C ,  G06F17/22 629
Fターム (3件):
5B109QA02 ,  5B109QA03 ,  5B109VC01
引用特許:
審査官引用 (8件)
全件表示

前のページに戻る