文献
J-GLOBAL ID:201502212717770311   整理番号:15A0367926

Dense符号化のための文法圧縮分割

Grammar Compression Parsing for Dense Coding
著者 (3件):
資料名:
巻: 2014  号: AL-149  ページ: VOL.2014-AL-149,NO.5 (WEB ONLY)  発行年: 2014年09月05日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
入力テキストを単語毎に符号化するEnd-Tagged Dense符号(ETDC)は,バイト単位の可変長符号を用いる,符号語の抽出が容易な検索向きのデータ圧縮法である。本稿では,単語毎に分かち書きされていないテキストに対してETDCで符号化する手法を提案した。提案手法は,テキストに対して文法圧縮の一つであるRe-Pairアルゴリズムを利用した分かち書きを行い,その後にETDCで符号化を行う。その際,Re-Pairアルゴリズムの再帰処理において,後段のETDCの符号化の効率を見積もる評価指標を導入し,その指標に基づいて再帰を打ち切る。それにより,日本語テキストやゲノムデータなどに対しても,検索や圧縮率の観点から効率よいデータ圧縮が実現できる。今回,実データに対して提案手法を適用することで,gzipやbzip2に匹敵する圧縮率を達成できることを実証した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
符号理論  ,  自然語処理 
引用文献 (10件):
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る