特許
J-GLOBAL ID:200903081739957678

確率テーブル作成装置、確率方式言語処理装置、認識装置、及び、記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-127938
公開番号(公開出願番号):特開平11-328318
出願日: 1998年05月11日
公開日(公表日): 1999年11月30日
要約:
【要約】【課題】 高速,低メモリ容量および高精度な確率方式言語処理を可能にする。【解決手段】 ユニグラム作成部19はユニグラムを求める。ダイグラム作成部20はダイグラムを求める。属性トリグラム作成部21は属性トリグラムを求める。ベクトル分割部23は上記ダイグラムを認識対象文字数次元のベクトルに分割する。クラスタリング部24は、各ベクトルをクラスタリングして文字とクラスタコード(圧縮文字コード)とを対応付けた圧縮文字コード変換テーブル13を作成する。圧縮ダイグラム作成部は2圧縮文字コード組みの遷移確率(圧縮ダイグラム)を求める。上記圧縮ダイグラムは、上記ダイグラムが有している言語的な遷移情報を失うことなく要素数が大幅に圧縮されている。また、失われた言語的情報は、ユニグラムと属性トリグラムとの併用によって補われて、上記低容量メモリ性および高速性を損なうことなく高精度な言語処理を可能にする。
請求項(抜粋):
一つの自然言語の文字列が格納されたメモリと、上記メモリに格納された文字列の総ての文字を類似した遷移特性を有するクラスタにクラスタリングし、各クラスタにクラスタコードを付与するクラスタリング部と、上記メモリに格納された文字列における各文字のクラスタコードを求め、上記文字列における総ての隣接2文字に関してその2文字のクラスタコード間の遷移確率を求めて2クラスタコード遷移確率テーブルを作成する2クラスタコード遷移確率テーブル作成部を備えたことを特徴とする確率テーブル作成装置。
FI (2件):
G06K 9/72 C ,  G06K 9/72 Z
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る