admin 管理员组

文章数量: 1087649

最近项目上碰到在windows上压缩了一些图片,图片文件名称都是中文的,scp到linux下用unzip解压后文件名

全是乱码,找了半天解决方案,下面这个亲测可行,特记录一下,与大家分享:

原因:

由于zip在压缩时并没有指定编码格式,Windows下生成的zip文件中的编码是GBK/GB2312等,而Linux下的默认编码是UTF8因此,

导致这些zip文件在Linux下解压时出现中文乱码问题。

解决方案:

使用7z解压。

安装7zip和convmv

# fedora
$ su -c 'yum install 7zip convmv'
# ubuntu
$ sudo apt-get install 7zip convmv

执行一下命令解压缩

# 使用7z解压缩
$ LANG=C 7za x your-zip-file.zip
# 递归转码,从GBK转为UTF-8
$ convmv -f GBK -t utf8 --notest -r .

还有一个更加便捷的方法:

解决的方法是 加上CP936选项,这里的CP936,有些人可能不明白,其实最早的GBK编码,就是IBM定制的MBCS字符集,汉子编码正好在整个字符集中的936页,因此好多地方其实都是用CP936来代表GBK

unzip -O CP936 xxx.zip

更多参考: https://blog.csdn/IndexMan/article/details/8018847
https://wwwblogs/louyihang-loves-baiyan/p/4864301.html

本文标签: 乱码 压缩包 中文 Windows Zip