特許
J-GLOBAL ID:201403000531781045
コーパス生成装置、コーパス生成方法、及びコーパス生成プログラム
発明者:
出願人/特許権者:
代理人 (3件):
長谷川 芳樹
, 黒木 義樹
, 保坂 一之
公報種別:特許公報
出願番号(国際出願番号):特願2014-508630
特許番号:特許第5576003号
出願日: 2013年09月30日
要約:
【要約】 実施形態に係るコーパス生成装置は、ウェブページ取得部、基準語取得部、付与部及び出力部を備える。ウェブページ取得部は、提示対象に関する説明文データを含むウェブページを取得する。基準語取得部は、ウェブページから提示対象に関する属性値である基準語を取得する。付与部は、属性値間の上下関係を表す上下関係情報を記憶する記憶部から、基準語取得部により取得された基準語よりも上位に属する上位語を抽出し、説明文データに含まれる上位語に対して、基準語に対応する属性タグを付与する。出力部は、付与部により属性タグが付与された説明文データをコーパスデータとして出力する。
請求項(抜粋):
【請求項1】 提示対象に関する説明文データを含むウェブページであり、前記提示対象に関する属性名と属性値とが対応付けられた属性リストを更に含む、該ウェブページを取得するウェブページ取得部と、
前記ウェブページの属性リストにおける属性値を前記提示対象に関する属性値である基準語として取得する基準語取得部と、
属性値間の上下関係を表す上下関係情報を記憶する記憶部から、前記基準語取得部により取得された前記基準語よりも上位に属する上位語を抽出し、前記説明文データに前記上位語が含まれる場合には、前記説明文データに含まれる前記上位語に対して、前記基準語に対応する属性名を示す属性タグを付与する付与部と、
前記付与部により属性タグが付与された説明文データをコーパスデータとして出力する出力部と、
を備えるコーパス生成装置。
IPC (3件):
G06F 17/21 ( 200 6.01)
, G06F 17/27 ( 200 6.01)
, G06F 17/30 ( 200 6.01)
FI (6件):
G06F 17/21 550 A
, G06F 17/21 501 T
, G06F 17/27 Z
, G06F 17/30 170 A
, G06F 17/30 210 A
, G06F 17/30 220 B
引用特許:
前のページに戻る