Pat
J-GLOBAL ID:200903004481881340
読み付与装置、およびプログラム
Inventor:
,
Applicant, Patent owner:
,
Agent (1):
谷川 英和
Gazette classification:公開公報
Application number (International application number):2007233825
Publication number (International publication number):2009064383
Application date: Sep. 10, 2007
Publication date: Mar. 26, 2009
Summary:
【課題】従来、精度高く、キーワードの読み情報を取得できなかった。【解決手段】キーワードを受け付ける受付部と、用語と当該用語の読みを示す読み情報を有する用語読み情報を2以上格納している読み辞書に対して、キーワードまたはキーワードを分割した文字列である2以上の各分割文字列である対象文字列を用いて検索し、2以上の読み情報を取得する読み辞書検索部と、対象文字列と2以上の読み情報のうちの各読み情報の組である各取得対象文字列読み情報を用いて、文書群を検索し、各取得対象文字列読み情報が有する対象文字列と読み情報が共起する文書の数である共起頻度を、読み情報ごとに取得する共起頻度取得部と、取得された読み情報ごとの共起頻度を用いて、少なくとも最も共起頻度の多い読み情報または読み情報の組み合わせを出力する出力部を具備する読み付与装置により、精度高く、読み情報を取得できる。【選択図】図1
Claim 1:
キーワードを受け付ける受付部と、
用語と、当該用語の読みを示す読み情報を有する用語読み情報を2以上格納している読み辞書に対して、前記受付部が受け付けたキーワードまたは当該キーワードを分割した文字列である2以上の各分割文字列である対象文字列を用いて検索し、2以上の読み情報を取得する読み辞書検索部と、
前記対象文字列と、前記読み辞書検索部が取得した2以上の読み情報のうちの各読み情報の組である各取得対象文字列読み情報を用いて、文書群を検索し、前記各取得対象文字列読み情報が有する対象文字列と読み情報が共起する文書の数である共起頻度を、読み情報ごとに取得する共起頻度取得部と、
前記共起頻度取得部が取得した読み情報ごとの共起頻度を用いて、少なくとも最も共起頻度の多い読み情報、または最も共起頻度の多い読み情報の組み合わせを出力する出力部を具備する読み付与装置。
IPC (2):
FI (3):
G06F17/22 512R
, G06F17/22 514U
, G06F17/30 320C
F-Term (9):
5B009MB21
, 5B009MJ04
, 5B075ND03
, 5B075NK02
, 5B075NK34
, 5B075NR05
, 5B075PP25
, 5B109MB21
, 5B109MJ04
Patent cited by the Patent:
Cited by applicant (5)
Show all
Cited by examiner (4)