数据压缩入门
上QQ阅读APP看书,第一时间看更新

第4章 VLC

上一章所举的例子说明了两个问题:一是可以通过用更少或更多的二进制位对某些符号编码来节省所需要的总空间;二是当数据集中有重复符号时,这个方法就不太有用了。我们必须面对这个问题,因为在真实的数据集中,符号重复几乎无法避免。

这就是为什么LOG2方法无法正确地表示一个数据集中所真正包含的信息内容。本章将向你展示怎样利用概率和重复来做一些漂亮的工作,最终产生让人印象深刻的压缩结果。