最小期待符号語長とESC確率推定切換え法に基づく改良PPM<sup>*</sup>

友國恵太; 山本博資

文献

J-GLOBAL ID：201102245239634993 整理番号：11A0849497

最小期待符号語長とESC確率推定切換え法に基づく改良PPM^*

An improved PPM^* Algorithm based on the Minimal Expected Codeword Length and Switching Escape Probability Estimation

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=11A0849497&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=11A0849497&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (2件)： ,
資料名：
巻： 110 号： 443(ISEC2010 72-133) ページ： 235-242 発行年： 2011年02月24日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

PPMにおいて用いられるESCはsuffix tree上のあるノードで新しい文字が出現することを意味する。これまでにそのESC確率を推定するための様々な手法が提案されてきた。しかし,それらのESC確率の推定値はESCの実際の頻度分布と大きくずれる場合があり,このずれがPPMの圧縮率を悪くしている。Calgary Corpus,Canterbury Corpus,Large Corpusに対して,PPMXで用いられるESC確率の推定値は,suffix tree上の枝数が多いノードにおいてはESCの実際の頻度分布とよく一致しているが,枝数が少ないノードにおいてはESCの実際の頻度分布よりも低く見積もられる。そこで本稿では,ESCの実際の頻度分布により近い推定値を出力できるように,suffix tree上のそれぞれのノードの枝数に応じて,PPMXの推定法とその改良推定法を切り換える手法(ESC確率推定切換え法)を提案する。友國-山本[6]はPPM^*の改良法として,符号語長の期待値が最小となる文脈のもとで符号化を行う手法(期待値法)を提案している。この期待値法とESC確率推定切換え法を組み合わせて用いた場合,それぞれのCorpusに対して,現在PPMファミリーの中で最も良い圧縮率を達成するPPMZよりも良い圧縮率が得られることを示す。(著者抄録)

, , , , , , , , , , ,
, , ,

システムプログラミング一般 , システム・制御理論一般 , 符号理論

, , ,

前のページに戻る

最小期待符号語長とESC確率推定切換え法に基づく改良PPM*

最小期待符号語長とESC確率推定切換え法に基づく改良PPM^*