抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
大語彙連続音声認識器の学習データに対する書き起こしコスト削減のための複数の認識器を利用した能動学習手法を提案する。この手法では複数の認識器から得られた複数の異なる認識結果文を用いて発話の選択を行う。認識結果文をアラインメントするためのプログレッシブ法とVoting Entropyを発話選択に用いている。提案手法を日本語話し言葉コーパスの190時間の音声データを使い評価し,能動学習を行わないランダムな発話選択より顕著に良い結果を得た。74%の単語正解精度を得るために必要な書き起こし付きデータ量はランダム選択では97時間,単語事後確率を用いた従来手法では72時間であるが,提案手法では60時間で済むという結果になった。(著者抄録)