統計的言語モデル作成方法及び装置並びにプログラム

発明者： , , , , ,
出願人/特許権者：
代理人 (1件)：伊藤進
公報種別：公開公報
出願番号（国際出願番号）：特願2002-054441
公開番号（公開出願番号）：特開2003-255985
出願日： 2002年02月28日
公開日（公表日）： 2003年09月10日
要約：

【要約】【課題】ユーザによって有効なユーザ統計的言語モデルを容易に作成可能にする。【解決手段】コーパス解析部102はテキストの形態素解析結果を出力する。コーパス統計集計部103は形態素解析結果を集計して、統計情報を得る。統計情報履歴作成部104は、コーパス統計集計部103からの統計情報と、統計情報履歴データベース105に蓄積されている統計情報履歴とを結合して、新たな統計情報履歴として統計情報履歴データベース105に蓄積する。ユーザ統計的言語モデル作成部106は、この統計情報履歴を用いてユーザ統計的言語モデルを作成する。これにより、ユーザが逐次テキストを指定することで、ユーザ統計的言語モデルを拡充し、有効なユーザ統計的言語モデルを得ることができる。

請求項（抜粋）：

テキストデータを形態素解析して形態素解析結果を出力するテキスト解析ステップと、前記テキスト解析ステップにおける解析結果から統計情報を収集するテキスト統計集計ステップと、前記テキスト統計集計ステップにおいて収集した統計情報と統計情報履歴データベースに蓄積されている統計情報履歴とを結合して新たな統計情報履歴を前記統計情報履歴データベースに蓄積させる統計情報履歴作成ステップと、前記統計情報履歴データベースに蓄積されている統計情報履歴を用いてユーザ統計的言語モデルを作成するユーザ統計的言語モデル作成ステップとを具備したことを特徴とする統計的言語モデル作成方法。

IPC (3件)：

G10L 15/18 , G06F 17/28 , G10L 15/06

FI (6件)：

G06F 17/28 C , G06F 17/28 V , G10L 3/00 537 D , G10L 3/00 521 C , G10L 3/00 521 S , G10L 3/00 537 G

Fターム (9件)：

5B091AA15 , 5B091CA02 , 5B091CB12 , 5B091CC01 , 5B091CC16 , 5B091EA01 , 5D015BB01 , 5D015GG01 , 5D015HH00

引用特許：

審査官引用 (5件)

自然言語処理用データベース装置
公報種別：公開公報出願番号：特願平9-339815 出願人：沖電気工業株式会社
日本語統計データ作成装置および方法、並びにディクテーションシステム
公報種別：公開公報出願番号：特願平11-222560 出願人：株式会社東芝
特開平2-301869

全件表示

前のページに戻る