文献
J-GLOBAL ID:200902232824278296   整理番号:09A0203738

スライド情報を用いた言語モデル適応による講義音声認識

Automatic Lecture Transcription by Exploiting Slide Information for Language Model Adaptation
著者 (4件):
資料名:
巻: 50  号:ページ: 469-476  発行年: 2009年02月15日 
JST資料番号: Z0778B  ISSN: 1882-7837  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
大学などの講義で使用されるスライドの情報を用いて,言語モデルを動的に適応することにより,音声認識の高精度化を実現する方法を提案する。まず,当該講義のスライド全体のテキストを用いて,PLSA(Probabilistic Latent Semantic Analysis)によりN-gramモデルの話題への適応を行う。次に,発話に対応する個々のスライドの情報を用いて,キャッシュモデルによりスライドに現れる単語の確率を強化し,認識結果のリスコアリングを行う。京都大学で行われた技術講習会と正規の講義を対象とした音声認識において評価を行った結果,PLSAによる大域的な適応とキャッシュモデルによる局所的な適応を組み合わせることにより,認識精度の有意な改善が得られた。特に,キーワードの検出で大きな改善が得られ,大学の講義でも80%に近い精度(F値)を実現した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  情報加工一般 
引用文献 (18件):
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る