Pat
J-GLOBAL ID:201603019591062151
テキストデータの分かち書き単位分割プログラム及び電子図書再生装置
Inventor:
,
Applicant, Patent owner:
Agent (1):
特許業務法人綿貫国際特許・商標事務所
Gazette classification:公開公報
Application number (International application number):2014134912
Publication number (International publication number):2016012315
Application date: Jun. 30, 2014
Publication date: Jan. 21, 2016
Summary:
【課題】日本語のテキストデータを句読点で区切られた一文よりも短く且つ意味のある範囲で区切るプログラムを提供する。【解決手段】日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とを実現する。【選択図】図1
Claim (excerpt):
コンピュータに読み込み可能なプログラムであって、
日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、
分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とをコンピュータに実現させることを特徴とするテキストデータの分かち書き単位分割プログラム。
IPC (6):
G06F 17/21
, G06F 17/27
, G06F 3/16
, G10L 13/10
, G10L 13/00
, G10L 19/00
FI (8):
G06F17/21 550A
, G06F17/27 E
, G06F3/16 330C
, G10L13/10 111D
, G10L13/10 113B
, G10L13/00 100R
, G10L13/00 100B
, G10L19/00 312F
F-Term (2):
Patent cited by the Patent:
Cited by examiner (8)
-
テキスト解析装置
Gazette classification:公開公報
Application number:特願平6-268853
Applicant:沖電気工業株式会社
-
特開平4-199421
-
特開昭63-062032
Show all
Article cited by the Patent:
Cited by examiner (2)
-
事例で学ぶ テキストマイニング 初版 Text Mining : Learning through Case Studies, 20080115, 第1版, p.5-6
-
サーチアーキテクチャ 初版, 20071010, 第1版, p.106-107
Return to Previous Page