対話戦略学習方法、対話戦略学習プログラム、記憶媒体、および、対話戦略学習装置

Inventor： , ,
Applicant, Patent owner：
Agent (1)：磯野道造
Gazette classification：公開公報
Application number (International application number)：2004252323
Publication number (International publication number)：2006072477
Application date： Aug. 31, 2004
Publication date： Mar. 16, 2006
Summary：

【課題】対話戦略を学習するまでに必要な手間を削減すること。【解決手段】対話戦略学習装置2が、マルコフ決定過程を学習するために、ユーザ端末への応答に対する評価値の入力を受け付ける手順と、状態の遷移の頻度に着目して類似する1つ以上の状態を1つのクラスタに統合する手順と、強化学習法によって評価値およびクラスタから第1マルコフ決定過程を作成する手順と、第1マルコフ決定過程のクラスタを統合される前の状態に分解して第2マルコフ決定過程を作成して記憶手段に記憶する手順と、第2マルコフ決定過程を対話システムで使用するマルコフ決定過程として出力する手順と、を実行することを特徴とする。【選択図】図1

Claim (excerpt)：

ユーザ端末からの問い合わせ内容を、変数名を示すスロットと、そのスロットに代入される値との組で表現するシステム理解状態として保持し、現時点までに収集した対話データをもとにした対話の進捗度合いを表す有限個の状態と、前記状態において対話システムの次の発話内容を決定するための有限個のシステム行動から構成されるマルコフ決定過程に従って、前記システム理解状態から次のシステム行動を選択し、前記次のシステムの行動をもとにユーザ端末に応答する前記対話システムにおいて、前記マルコフ決定過程を学習する対話戦略学習方法であって、コンピュータが、前記ユーザ端末への応答に対する評価値の入力を受け付ける手順と、前記状態の遷移の頻度に着目して類似する1つ以上の状態を1つのクラスタに統合する手順と、強化学習法によって前記評価値および前記クラスタから第1マルコフ決定過程を作成する手順と、前記第1マルコフ決定過程のクラスタを統合される前の状態に分解して第2マルコフ決定過程を作成して記憶手段に記憶する手順と、前記第2マルコフ決定過程を前記対話システムで使用するマルコフ決定過程として出力する手順と、を実行することを特徴とする対話戦略学習方法。

IPC (3)：

G06N 3/00 , G06N 5/04 , G10L 15/22

FI (3)：

G06N3/00 560A , G06N5/04 570A , G10L3/00 571U

F-Term (1)：

5D015LL11

Article cited by the Patent：

Cited by examiner (3)

Optimizing Dialogue Management with Reinforcement Learning: Experiments with the NJFun System
Reinforcement Learning With Soft State Aggregation
音声言語インタフェースの実用化と音声言語対話への展開 Recent Advancements of Spoken Language Interfa

Return to Previous Page