Pat
J-GLOBAL ID:201503020620098757
情報処理装置、情報処理方法、およびプログラム
Inventor:
,
Applicant, Patent owner:
Agent (5):
大野 聖二
, 森田 耕司
, 鈴木 守
, 津田 理
, 加藤 真司
Gazette classification:公開公報
Application number (International application number):2014041983
Publication number (International publication number):2015169951
Application date: Mar. 04, 2014
Publication date: Sep. 28, 2015
Summary:
【課題】学習データを単語分割し、分割された単語の意味的な類似度を自動的に獲得する情報処理装置を提供する。【解決手段】文字Nグラムまたは単語分割モデルを用いて学習データを単語分割する単語分割部11と、分割された単語のデータに基づいて文字Nグラムの学習を行う文字Nグラム学習部12と、分割された単語のデータに基づいて単語分割モデルの学習を行う単語境界学習部16と、再帰型ニューラルネットワークで表される単語Nグラムの学習を行う単語Nグラム学習部14とを備える。文字Nグラムを用いた単語分割と単語分割モデルを用いた単語分割とを交互に行う処理と、単語Nグラムを学習する処理とを所定の収束条件を満たすまで繰り返し行う。そして、学習が行われた単語Nグラムの再帰型ニューラルネットワークに単語のデータを入力し、中間層にて求められるベクトルを概念ベクトルとして求める。【選択図】図1
Claim (excerpt):
学習データとして文のデータを入力する入力部と、
文字Nグラムまたは単語分割モデルを用いて前記学習データを単語分割する単語分割部と、
分割された単語のデータに基づいて文字Nグラムの学習を行い、学習した文字Nグラムを文字Nグラム記憶部に記憶する文字Nグラム学習部と、
分割された単語のデータに基づいて単語境界の認識を行う系列ラベリングによる単語分割モデルの学習を行い、学習によって得られた単語分割モデルを単語分割モデル記憶部に記憶する単語境界学習部と、
入力層、中間層及び出力層を有し、中間層からの出力を入力層にも入力する再帰型ニューラルネットワークで表される単語Nグラムを、分割された単語のデータを教師データとして用いて学習し、単語Nグラム記憶部に記憶する単語Nグラム学習部と、
前記単語Nグラム記憶部に記憶されている再帰型ニューラルネットワークに単語のデータを入力し、中間層にて求められるデータを概念データとして求める概念データ算出部と、
前記概念データを出力する出力部と、
を備え、
前記単語分割部が、前記文字Nグラム学習部にて学習された文字Nグラムを用いた単語分割と前記単語境界学習部にて学習された単語分割モデルを用いた単語分割とを交互に行う処理と、前記単語Nグラム学習部が前記単語分割部にて分割された単語のデータを用いて単語Nグラムを学習する処理とを、所定の収束条件を満たすまで繰り返し行う情報処理装置。
IPC (2):
FI (3):
G06F17/27 E
, G06F17/27 Z
, G06N3/00 560E
F-Term (4):
5B091AA11
, 5B091CA02
, 5B091CC04
, 5B091EA01
Patent cited by the Patent: