admin 管理员组文章数量: 1086019
2024年7月3日发(作者:jealousvue强)
-
【图像编码】【文件格式】
本次团队合作充分将时间的利用率到达了最高化,我们用了2天将思路制定以及
部根据自己的喜好分成2组,有人肯定会说不是给你们题目了么?还制定什么思
路?因为这次题目比拟宽广,我们需要挑选重点以及难点来进展讲解,况且前期
的准备工作充分了,对于后面接下来的过程将会更加得心应手,目的性明确。我
们小组里图像编码和文件格式又各分一组,用了3天的时间查找资料以及用了最
后2天我们在图书馆以及网上进展了讨论总结。
【图像编码】
1. 为什么要使用图像编码
答:图像编码主要利用图像信号的统计特性以及人类视觉的生理学及心理学特
性,对图像信号进展高效编码,即研究数据压缩技术,目的是在保证图像质量
的前提下压缩数据,便于存储和传输,以解决数据量大的矛盾。一般来说,图
像编码的目的有单个:1.减少数据存储量2.降低数据率以减少传输带宽3.压缩
信息量,便于特征提取,为后续识别做准备。
2. 经典编码技术
2.1熵编码
行程编码
哈夫曼编码【原理】
算术编码
优点:
编码过程中按熵原理不丧失任何信息,根据消息出现概率的分布特性而进展
的,是无损数据压缩编码。
缺点:
使用长度不同的比特串对字母进展编码有一定的困难。尤其是,几乎所有
几率的熵都是一个有理数。
2.2预测编码
差分脉冲编码调制
自适应差分脉冲编码调制
帧间预测
优点:
在同等精度要求的条件下,就可以用比拟少的比特进展编码,到达压缩数据
的目的。
缺点:在于当图像中有运动物体时,两个传输帧在物体经过的区域上不再一一对应,
因而引起图像模糊。
2.3变换编码〔压缩比最高〕
2.1.1 K-L变换
离散余弦编码
优点:
在时域或空域描述时,数据之间相关性大,数据冗余度大,经过变换在变换
域中描述,数据相关性大大减少,数据冗余量减少,参数独立,数据量少,这样再进
展量化,编码就能得到较大的压缩比。
缺点:
间接编码编码时间较长,压缩时间复杂度较大。
2.4混合编码
优点:
这种方法克制了原有波形编码与参数编码的弱点,并且结合了波形编码的高
质量和参数编码的低数据率,取得了比拟好的效果。
缺点:不便于解码等工作
3. 第二代编码技术
3.1分型编码
-
压缩比高,压缩后的文件容量与图像像素数无关,在压缩时时间长但解压缩速度快
3.2小波变换编码
优点:能够很好消除图像数据中的统计冗余,利用了人眼视觉的特性机制。
适应于高压缩比应用领域。
缺点:离散余弦变换、弱化各子带的统计特性。
4. 【文件格式】
1. 一般图片有些什么格式
●BMP 是一个无压缩的图片,画面质量比拟好,它了包含的图像信息较丰
富,支持1, 4, 8, 16, 24, 32位深度,通常用处在于Windows操作系统
中的标准图像文件格式能够被多种Windows应用程序所支持,但是美中缺
乏的就是文件体积大需要存空间大。
●Jpeg是一种有损压缩后的图片,用在网络网页图形图像信息显示比拟
多,用有损压缩方式去除冗余的图像和彩色数据获得极高的压缩率同时能
展现十分丰富生动的图像用最少的磁盘空间得到较好的图像质量
可以调节压缩的比率在质量和大小之间找到最正确点。这种就类似了我们
听音乐的MP3技术,去除一些我们人耳无法识别或者说有没有没有关系的
声音,我们的图片也是一样。
●GIF通常用于网络传输和图像交换,他的优点是压缩比高,磁盘空间占
用较少,支持动画,GIF图像格式还增加了渐显方式在图像传输过程中,
用户可以先看到图像的大致轮廓然后随着传输过程的继续而逐步看清图
像中的细节局部从而适应了用户的"从朦胧到清楚"的欣赏心理。然而做过
的都知道一般上的图片GIF占多,同样如果分别采用JPEG和GIF的,当
然他们的图像是一样的,这样说来肯定是翻开GIF的比拟快。
●PNG是同时使用了LZ77算法与哈夫曼编码〔Huffman Coding〕的一个
无损数据压缩算法。PNG是目前保证最不失真的格式它汲取了GIF和JPG
二者的优点存贮形式丰富兼有GIF和JPG的色彩模式它的另一个特点能把
图像文件压缩到极限以利于网络传输但又能保存所有与图像品质有关的
信息因为PNG是采用无损压缩方式来减少文件的大小这一点与牺牲图像
品质以换取高压缩率的JPG有所不同它的第三个特点是显示速度很快只
需下载1/64的图像信息就可以显示出低分辨率的预览图像。
PNG同样支持透明图像的制作透明图像在制作网页图像的时候很有用我
们可以把图象背景设为透明用网页本身的颜色信息来代替设为透
明的色彩这样可让图像和网页背景很和谐地融合在一起。
●TGA采用了游程编码和行程长度编码的方式它在加压缩和解压缩都非
常快是一种无损数据压缩,但是并不适用于连续色调图像的压缩例如日常
生活中的照片
2. 矢量图和标量图的区别
色彩空间转换
首先,图像由RGB〔红绿蓝〕转换为一种称为YUV的不同色彩空间。这与模拟
PAL彩色电视传输所使用的色彩空间相似,但是更类似于MAC电视传输系统运作
的方式。但不是模拟NTSC,模拟NTSC使用的是YIQ色彩空间。
•
Y成份表示一个像素的亮度
-
U和V成份一起表示色调与饱和度。
o
这种编码系统非常有用,因为人类的眼睛对于亮度差异的敏感度高于色
彩变化。使用这种知识,编码器〔encoder〕可以被设计得更有效率地压
缩图像。
•
•
•
缩减取样〔Downsampling〕
上面所作的转换使下一步骤变为可能,也就是减少U和V的成份〔称为"缩减取
样"或"色度抽样"〔chroma subsampling〕。在JPEG上这种缩减取样的比例可
以是4:4:4〔无缩减取样〕,4:2:2〔在水平方向2的倍数中取一个〕,以及最
普遍的4:2:0〔在水平和垂直方向2的倍数中取一个〕。对于压缩过程的剩余部
份,Y、U、和V都是以非常类似的方式来个别地处理。
•
什么是4:4:4 这也就是各个通道的抽样率〔这些知识我相信视频的同学会给
大家更好的解释〕未经压缩的每个象素3个字节
离散余弦变换〔Discrete cosine transform〕
将图像中的每个成份〔Y, U, V〕生成三个区域,每一个区域再划分成如磁砖般排列的
一个个的8×8子区域,每一子区域使用二维的离散余弦变换〔DCT〕转换到频率空间。
如果有一个如这样的的8×8的8-比特〔0~255〕子区域:
接着推移128,使其围变为 -128~127,得到结果为
且接着使用离散余弦变换,和舍位取最接近的整数,得到结果为
DCT公式:
量化〔Quantization〕
人类眼睛在一个相对大围区域,区分亮度上细微差异是相当的好,但是在一个高频率亮
度变动之确切强度的分辨上,却不是如此地好。这个事实让我们能在高频率成份上极佳
地降低信息的数量。简单地把频率领域上每个成份,除以一个对于该成份的常数就可完
成,且接着舍位取最接近的整数。这是整个过程中的主要有损运算。以这个结果而言,
经常会把很多更高频率的成份舍位成为接近0,且剩下很多会变成小的正或负数。
一个普遍的量化矩阵是:
使用这个量化矩阵与前面所得到的DCT系数矩阵,得到结果为:
举个例子,使用−415〔DC系数〕且舍位得到最接近的整数
-
熵编码技术〔entropy coding〕
Z字体扫描矩阵的顺序
熵编码是无损数据压缩的一个特别形式。它牵涉到将图像成份以Z字体〔zigzag〕排列,
把相似频率组群在一起〔矩阵中往左上方向是越低频率之系数,往右下较方向是较高频
率之系数〕,插入长度编码的零,且接着对剩下的使用霍夫曼编码。 JPEG标准也允许
〔但是并不要求〕在数学上优于霍夫曼编码的算术编码之使用。然而,这个特色几乎很
少被使用,因为它被专利所涵盖,且它相较于霍夫曼编码在编码和解码上会更慢。使用
算术编码一般会让文件更小约5%。
对于前者量化的系数所作的Z字体串行会是:
−26, −3, 0, −3, −3, −6, 2, −4, 1 −4, 1, 1, 5, 1, 2, −1, 1, −1, 2, 0, 0, 0, 0,
0, −1, −1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
当剩下的所有系数都是零,对于过早退出的串行,JPEG有一个特别的霍夫曼编码用词。
使用这个特殊的编码用词,EOB,该串行变为
−26, −3, 0, −3, −3, −6, 2, −4, 1 −4, 1, 1, 5, 1, 2, −1, 1, −1, 2, 0, 0, 0, 0,
0, −1, −1, EOB
压缩比率与不自然痕迹〔artifact〕
有损压缩导致的人为现象〔上〕与原图〔下〕,200%放大
按:artifact在这个领域又被解释为膺像、非自然信号、人为现象。
在量化阶段时,依照除数的不同,会使结果的压缩比率可能有很多变化。10:1通常可得
到无法使用肉眼分辨与原图差异的图像。100:1压缩通常是可行的,但与原图相较,会
看出明显的不自然痕迹。压缩的适当等级是依据要压缩那一种图像而定。
使用万维网的人,可能熟悉这种出现在JPEG数字图像,压缩人为现象的不规则现象。
这是由于JPEG算法的量化步骤所造成的结果。这种现象在脸部照片中的眼睛四周特别
明显。他们可以借由选择压缩的较低水平〔使用较低的压缩率〕来减少这种现象;他们
可能借由使用无损文件格式来存储一个图像来消除这种现象,然而针对照片图像,这样
通常会使文件大小增加。
总结:本次合作让我们深深体会到团队合作的重要性,俗话说得好:三个臭皮匠赛过诸
亮。我们作为数媒的学子,在未来将会有更加多的时机与挑战,一次次的作业,一次次
的课程设计,团队的合作越来越多,也希望我们在未来能有更多的合作时机。
版权声明:本文标题:各种格式的图像编码 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1719979076a741014.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论