如何使用Facebook开发的这种快速数据压缩算法Zstd
2018-06-23 来源:
需要的话,它可以牺牲压缩速度,换取更高的压缩比(压缩速度与压缩比这个组合可以逐级配置),反之亦然。它有一种用于小数据压缩的特殊模式,名为字典压缩,可以用提供的任何样本集来构建字典。它带有一个命令行实用程序,用于创建和解码.zst、.gz、.xz和.lz4等文件。
重要的是, Zstandard有一套丰富的API,支持几乎所有流行的编程语言,包括Python、Java、JavaScript、Nodejs、Perl、Ruby、C#、Go、Rust、PHP和Swift等语言。
它在Facebook积极用于压缩多种格式的大量数据,支持多种使用场景,适用于亚马逊Redshift数据仓库等服务、Hadoop和Redis等数据库、Tor网络以及包括游戏在内的其他许多应用。
通过使用lzbench这种开源的内存基准测试工具,在一台运行Linux Debian的服务器上执行几项快速压缩算法测试,获得了以下结果:
Zstandard压缩测试
如何在Linux中安装Zstandard压缩工具?
想在Linux发行版上安装Zstandard,你需要用源代码来编译,不过在此之前,需要使用发行版软件包管理器在系统上安装必要的开发工具,如下所示:
- $ sudo apt update && sudo apt install build-essential #Ubuntu/Debian
- # yum group install "Development Tools" #CentOS/REHL
- # dnf groupinstall "C Development Tools and Libraries" #Fedora 22+
一旦安装了所有需要的开发工具,可以下载源代码软件包,进入到本地仓库目录,构建二进制文件并安装,所下所示:
- $ cd ~/Downloads
- $ git clone https://github.com/facebook/zstd.git
- $ cd zstd
- $ make
- $ sudo make install
一旦Zstandard安装完毕,现在我们可以进一步学习下面部分中Zstd命令示例的一些基本用法。
学习Linux中10个Zstd命令使用示例
Zstd的命令行语法通常与gzip和xz工具类似,不过有几个差异。
1.想创建.zst压缩文件,只需提供一个压缩文件名即可,或者使用-z标志也意味着压缩,这是默认操作。
- $ zstd etcher-1.3.1-x86_64.AppImage
或者
- $ zstd -z etcher-1.3.1-x86_64.AppImage
2.想解压缩.zst压缩文件,使用-d标志或unzstd实用程序,如下所示:
- $ zstd -d etcher-1.3.1-x86_64.AppImage
或者
- $ unzstd etcher-1.3.1-x86_64.AppImage
3.想在压缩操作和后删除源文件,默认情况下,源文件在成功压缩或解压缩后不会被删除;想删除它,使用--rm选项。
- $ ls etcher-1.3.1-x86_64.AppImage
- $ zstd --rm etcher-1.3.1-x86_64.AppImage
- $ ls etcher-1.3.1-x86_64.AppImage
4.想设置压缩级别,Zstd有许多操作修改符,比如你可以指定压缩级别为-6 (数值1-19,默认值为3),如下所示:
- $ zstd -6 --rm etcher-1.3.1-x86_64.AppImage
5.想设置压缩速度,Zstd的压缩速度比为1-10,默认压缩速度为1。可以使用--fast选项,牺牲压缩比,换取更高的压缩速度;数值越大,压缩速度越快。
- $ zstd --fast=10 etcher-1.3.1-x86_64.AppImage
6.想显示有关压缩文件的信息,使用-l标志,这可以用来显示有关压缩文件的信息。
- $ zstd -l etcher-1.3.1-x86_64.AppImage.zst
7.想测试压缩文件的完整性,使用-t标志,如下所示:
- $ zstd -t etcher-1.3.1-x86_64.AppImage.zst
8.想启用详细模式,使用-v选项。
- $ zstd -v -5 etcher-1.3.1-x86_64.AppImage
9.想使用其他文件压缩或解压缩格式,比如gzip、xz、lzma和lz4,使用--format=FORMAT,如下所示:
- $ zstd -v --format=gzip etcher-1.3.1-x86_64.AppImage
- $ zstd -v --format=xz etcher-1.3.1-x86_64.AppImage
10.想将Zstd进程优先级设置为实时,可以使用选项-priority = rt,如下所示:
- $zstd --priority=rt etcher-1.3.1-x86_64.AppImage
-r标志指令Zstd对字典执行递归操作。只要查阅Zstd参考手册页,你就可以找到许多实用的高级选项,以及如何阅读或创建字典。
- $ man zstd
- Zstandard Github仓库:https://github.com/facebook/zstd
Zstandard是一种快速的实时无损数据压缩算法和压缩工具,提供了高压缩比。尝试一下,分享你的想法,也可以通过下面的反馈表来提问。
原文标题:zstd – A Fast Data Compression Algorithm Used By Facebook,作者:Aaron Kili
标签: CentOS linux 代码 服务器 数据库 网络
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。