文献
J-GLOBAL ID:201702232950197993   整理番号:17A0662570

放送ニュースのストーリー・セグメンテーションのためのモデル化潜在的トピックと時間的距離【Powered by NICT】

Modeling Latent Topics and Temporal Distance for Story Segmentation of Broadcast News
著者 (6件):
資料名:
巻: 25  号:ページ: 108-119  発行年: 2017年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,話題分割,トピックモデリングまたはGRTMにおけるグラフ正則化と呼ぶのためのテキストブロックの潜在的話題と時間的距離をモデル化するための戦略を研究した。学習潜在している話題表現,データ近接性を維持しながら,グラフ正則化は,潜在している話題表現を導くために関与しているが,データ近接と呼ばれるテキストブロックの時間的距離と語い類似性の両方を考慮した二つの新しい方法を提案した。最初の方法では,著者らは潜在的トピック推定のためのグラフの親和性行列の距離ペナルティ関数を導入することによってLaplacian潜在確率論的意味解析(LapPLSA)のアイデアを拡張した。推定潜在している話題分布は,テキストブロックのデータ表現として従来の単語頻度ベクトルを置換し,それらの間の凝集力を測定するために使用される。第二の手法では,Laplace固有マップ,次元縮小のためのグラフ正則化を利用し,従来のトピックモデリングにより推定した潜在している話題分布を行った。TDT2英語放送ニュースコーパスの自動音声認識転写物に関する実験を行った。実験は,提案した戦略は,従来の技術より優れているを示した。LapPLSAは0.816という最高のF1測度を持つ最もよい性能を示した。距離ペナルティ関数のペナルティ定数,潜在的課題の数,及びセグメンテーション性能に及ぼす訓練データの大きさの影響も研究した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  自然語処理 

前のページに戻る