特許
J-GLOBAL ID:201603019591062151

テキストデータの分かち書き単位分割プログラム及び電子図書再生装置

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人綿貫国際特許・商標事務所
公報種別:公開公報
出願番号(国際出願番号):特願2014-134912
公開番号(公開出願番号):特開2016-012315
出願日: 2014年06月30日
公開日(公表日): 2016年01月21日
要約:
【課題】日本語のテキストデータを句読点で区切られた一文よりも短く且つ意味のある範囲で区切るプログラムを提供する。【解決手段】日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とを実現する。【選択図】図1
請求項(抜粋):
コンピュータに読み込み可能なプログラムであって、 日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、 分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とをコンピュータに実現させることを特徴とするテキストデータの分かち書き単位分割プログラム。
IPC (6件):
G06F 17/21 ,  G06F 17/27 ,  G06F 3/16 ,  G10L 13/10 ,  G10L 13/00 ,  G10L 19/00
FI (8件):
G06F17/21 550A ,  G06F17/27 E ,  G06F3/16 330C ,  G10L13/10 111D ,  G10L13/10 113B ,  G10L13/00 100R ,  G10L13/00 100B ,  G10L19/00 312F
Fターム (2件):
5B091CA01 ,  5B109MB03
引用特許:
審査官引用 (8件)
全件表示
引用文献:
審査官引用 (2件)
  • 事例で学ぶ テキストマイニング 初版 Text Mining : Learning through Case Studies, 20080115, 第1版, p.5-6
  • サーチアーキテクチャ 初版, 20071010, 第1版, p.106-107

前のページに戻る