タイトル | ベイズ符号化アルゴリズムを用いたテキストデータ圧縮 |
---|---|
著者 | 中野晶 、小泉大城 、松嶋敏泰 |
年度 | 2006 |
形式 | 国内学会 |
分野 | 情報源符号化 |
掲載雑誌名 | 情報処理学会研究報告 |
掲載号・ページ | vol.110, no.3, pp.15-22 |
掲載年 | 2007 |
掲載月 | 1 |
アブスト (日本語) |
学会名:第110回アルゴリズム研究会 日程:2007年1月23日 場所:東京都 ベイズ符号は,情報源の確率分布のクラスは既知であり,そのパラメータは未知である場合のユニバーサル情報源符号化法で,ベイズ基準の下で冗長度を最小にする符号である.Context Tree情報源に対してベイズ符号を実現する手法として,逐次型ベイズ符号化アルゴリズムがあり,その必要メモリ量を削減したアルゴリズムとして改良型ベイズ符号化アルゴリズムがある.これらを用いてテキストデータを圧縮した際,モデルやパラメータの事前分布の不適合性より既存の圧縮ソフトウェアのbzip2などに圧縮性能で劣ることや,圧縮時の必要メモリ量が莫大なことなどから実用化には至っていない.本研究では,ベイズ符号の実用化に向けて,必要メモリ量に制約をおいた上で,テキストデータに適合する事前分布を導入することにより圧縮性能を向上させることを目的とする. |
アブスト (英語) |
|
備考 (日本語) |
1 |
備考 (英語) |
1 |
論文原稿 | |
発表資料 |