Pat
J-GLOBAL ID:201403013952056174
異表記取得装置、異表記取得方法、およびプログラム
Inventor:
,
,
,
,
,
Applicant, Patent owner:
Agent (1):
谷川 英和
Gazette classification:特許公報
Application number (International application number):2009299287
Publication number (International publication number):2011138440
Patent number:5470620
Application date: Dec. 30, 2009
Publication date: Jul. 14, 2011
Claim (excerpt):
【請求項1】編集距離が1以上の用語対を1以上格納し得る用語対格納部と、
用語対の異なる文字である編集箇所の字種に関する素性である字種関連素性、用語辞書を用いて取得された素性である辞書関連素性、前記用語対を構成する2つの用語の類似度を示す素性である類似度素性のうちの一以上の素性を含む複数の素性と、前記用語対が異表記の用語対であるかを示す情報である正負情報とを対応付けた学習データを2以上格納し得る学習データ格納部と、
前記用語対格納部の用語対ごとに、字種関連素性、辞書関連素性、類似度素性のうちの一以上を含む複数の素性を取得する素性取得部と、
前記各用語対に対して、前記学習データ格納部の2以上の学習データと、前記素性取得部が取得した複数の素性とを用いて、教師あり機械学習法により、前記用語対格納部の各用語対が異表記の用語対であるか否かを判断する機械学習部と、
前記機械学習部における判断結果を出力する出力部とを具備する異表記取得装置であって、
用語と、当該用語の代表表記とを有する1以上の用語情報を格納し得る用語辞書をさらに具備し、
前記辞書関連素性は、
用語対が有する2つの用語の代表表記が同一であるか否かを示す情報であり、
前記素性取得部は、
前記用語対格納部の用語対ごとに、用語対が有する2つの用語の代表表記を、前記用語辞書から取得し、当該取得した2つの代表表記が同一であるか否かを判断し、当該判断結果を辞書関連素性として取得する異表記取得装置。
IPC (1):
FI (1):
Patent cited by the Patent:
Article cited by the Patent:
Return to Previous Page