特許
J-GLOBAL ID:200903049056089114

情報処理装置、情報処理方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 谷川 英和
公報種別:公開公報
出願番号(国際出願番号):特願2007-066552
公開番号(公開出願番号):特開2008-226104
出願日: 2007年03月15日
公開日(公表日): 2008年09月25日
要約:
【課題】大規模なコーパスから、性能を担保しながら小規模なコーパスを選択する。【解決手段】情報処理装置1は、コーパスが記憶されるコーパス記憶部11と、サブコーパスが複数記憶される13サブコーパス記憶部と、コーパス記憶部11で記憶されているコーパスを文クラスタリングすることによりサブコーパスに分割し、サブコーパス記憶部13に蓄積するコーパス分割部12と、基準コーパスが記憶される基準コーパス記憶部14と、基準コーパスと、複数のサブコーパスとの類似性に関する情報である類似情報をそれぞれ算出する類似情報算出部15と、類似情報算出部15が算出した類似情報を用いて、基準コーパスと類似性の高い1または2以上のサブコーパスを選択する選択部16と、を備える。【選択図】図1
請求項(抜粋):
コーパスが記憶されるコーパス記憶部と、 前記コーパス記憶部で記憶されるコーパスが分割されたコーパスであるサブコーパスが複数記憶されるサブコーパス記憶部と、 前記コーパス記憶部で記憶されているコーパスを文クラスタリングすることにより前記サブコーパスに分割し、前記サブコーパス記憶部に蓄積するコーパス分割部と、 基準となるコーパスである基準コーパスが記憶される基準コーパス記憶部と、 前記基準コーパスと、前記複数のサブコーパスとの類似性に関する情報である類似情報をそれぞれ算出する類似情報算出部と、 前記類似情報算出部が算出した類似情報を用いて、前記基準コーパスと類似性の高い1または2以上のサブコーパスを選択する選択部と、を備えた情報処理装置。
IPC (3件):
G06F 17/28 ,  G10L 15/06 ,  G10L 15/18
FI (3件):
G06F17/28 U ,  G10L15/06 300Y ,  G10L15/18 300Z
Fターム (7件):
5B091AA15 ,  5B091CC01 ,  5B091CC16 ,  5B091EA01 ,  5B091EA17 ,  5B091EA24 ,  5D015GG00
引用特許:
審査官引用 (2件)
引用文献:
前のページに戻る