特許
J-GLOBAL ID:200903043939146217

情報処理装置、情報処理方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 谷川 英和
公報種別:公開公報
出願番号(国際出願番号):特願2007-228588
公開番号(公開出願番号):特開2009-064051
出願日: 2007年09月04日
公開日(公表日): 2009年03月26日
要約:
【課題】翻訳性能を劣化させることなく学習コーパスを小規模化することができる情報処理装置を提供する。【解決手段】所望のタスクに一致したドメインの、原言語の文と目的言語の文とを対応付けた対訳文を複数有するコーパスであるインドメイン対訳コーパスから生成されたインドメイン言語モデルが記憶される言語モデル記憶部13と、所望のタスクと異なるドメインの対訳文を複数有するコーパスであるアウトオブドメイン対訳コーパスが記憶されるアウトオブドメイン対訳コーパス記憶部14と、インドメイン言語モデルを用いて、インドメイン対訳コーパスと、アウトオブドメイン対訳コーパスに含まれる各文との類似性に関する類似情報をそれぞれ算出する類似情報算出部15と、類似情報を用いて、インドメイン対訳コーパスと類似性の高い複数の対訳文をアウトオブドメイン対訳コーパスから選択する選択部16とを備える。【選択図】図1
請求項(抜粋):
所望のタスクに一致したドメインのコーパスであり、原言語の文と目的言語の文とを対応付けた対訳文を複数有するコーパスであるインドメイン対訳コーパスから生成された言語モデルであるインドメイン言語モデルが記憶される言語モデル記憶部と、 前記所望のタスクと異なるドメインのコーパスであり、原言語の文と目的言語の文とを対応付けた対訳文を複数有するコーパスであるアウトオブドメイン対訳コーパスが記憶されるアウトオブドメイン対訳コーパス記憶部と、 前記インドメイン言語モデルを用いて、当該インドメイン言語モデルの生成で用いられたインドメイン対訳コーパスと、前記アウトオブドメイン対訳コーパスに含まれる各文との類似性に関する情報である類似情報をそれぞれ算出する類似情報算出部と、 前記類似情報を用いて、前記インドメイン対訳コーパスと類似性の高い複数の対訳文を前記アウトオブドメイン対訳コーパスから選択する選択部と、を備えた情報処理装置。
IPC (1件):
G06F 17/28
FI (1件):
G06F17/28 U
Fターム (1件):
5B091DA11

前のページに戻る