首页编程正文内容

H.264文件解析与码流分析_h.264 获取图片

编程

更新时间：2026-04-03 08:50:19 13

admin 管理员组

文章数量: 1184232

概述

目前，H.264视频压缩编码方式仍在视频压缩领域有一席之地，所熟知的MPEG-4 AVC与MPEG-4 Part 10方式，均指H.264。其主要编码过程以去除各种冗余信息为目的，包含数据变换、基于运动补偿的帧间预测、熵编码和量化过程。

本实验通过使用软件对一个mp4文件进行码流信息查看，并分析其基本信息、帧信息等参数，并对其比例与概率等参数进行绘制分析，以熟悉文件的结构与编码方式。

所用软件： H264Visa 、 Elecard StreamEye Tools 。

实验步骤

一、打开文件

使用 H264Visa 软件，打开一个h264编码的mp4文件后，可看到软件出现了四个信息窗口：

Summary
显示文件整体的信息。
Header Info
显示当前文件信息的数值。其中提取的重要信息包含SPS、PPS等信息。
MB Info 和 Pixel Info
两窗口分别显示当前选取的宏块的信息以及宏块内所有像素的信息。

二、文件信息分析

1、SPS信息

SPS信息即SPS即Sequence Paramater Set，又称作序列参数集。SPS中保存了一组编码视频序列(Coded Video Sequence)的全局参数。

通过其中的参数可求得文件图像序列的信息。重要参数包括：

profile_idc
标识当前码流的profile。H264的profile参数定义包含Baseline、Main、Extended 和 High 等档次，直观影响的是GOP内IPB帧的比例关系。profile_idc 所对应的档次如下：

此实验中可看到对应值为100，即本视频所用的 profile 为 High。
constraint_set[%d]_flag
此字段一般有多个，是对视频序列的码流编码档次方面增加限制性条件的参数。
level_idc
标识当前码流的level。其level参数的真值为level_idc/10，对应下表。

可见此实验文件中level的值为3.1。
log2_max_frame_num_minus4
用于计算MaxFrameNum的值。计算公式为MaxFrameNum = 2 ^{(log2_max_frame_num_minus4 +4)} 。MaxFrameNum的物理含义是frame_num的上限值，frame_num是图像序号的一种表示方法，在帧间编码中常用作一种参考帧标记的手段。
此文件中的 MaxFrameNum 值为 2 ⁶ = 64。
pic_order_cnt_type
表示解码picture order count(POC)的方法，取值空间为 0、1 或 2。
gaps_in_frame_num_value_allowed_flag
标识位，说明frame_num中是否允许不连续的值。
pic_width_in_mbs_minus1
用于计算图像的宽度，单位为宏块个数。
因序列使用宏块为16×16，故其图像宽度公式为
frame_width = 16 × (pic_width_in_mbs_minus1 + 1)
pic_height_in_map_units_minus1
用于计算图像的高度，单位为宏块个数，公式为
frame_height = 16 × (pic_height_in_map_units_minus1 + 1)

至此，使用 pic_width_in_mbs_minus1和 pic_height_in_map_units_minus1可直接得到图像分辨率：
frame_width = 16 × (pic_width_in_mbs_minus1 + 1) = 640
frame_height = 16 × (pic_height_in_map_units_minus1 + 1) = 368
故图像分辨率为640×368。
使用VLC打开文件，发现确实为此分辨率。

frame_mbs_only_flag
标识位，说明宏块的编码方式。等于0时表示本序列中所有图像的编码模式都是帧，等于1时表示本序列中的编码模式可能是帧或场或帧场自适应。
direct_8x8_inference_flag
标识运动向量的预测方法，frame_mbs_only_flag为0时此处则应为1。
frame_cropping_flag
标识是否需要对输出图像进行裁剪，要裁剪（=1）时需要再声明裁剪的边缘位置frame_cropping_rect_left_offset，frame_cropping_rect_right_offset，frame_cropping_rect_top_offset，frame_cropping_rect_bottom_offset。
vui_parameters
标识码流中是否有vui子结构。同时，其中 time_scale 与num_unis_in_tick 可以对视频的帧率进行计算。公式为
frame = time_scale / num_unis_in_tick
本实验中的 time_scale 与 num_unis_in_tick 分别为96和4，故其帧率为24，与VLC中读取信息相同。

2、PPS信息

PPS信息即Picture Paramater Set，图像参数集，也为表征序列图像信息的数据。其与SPs信息共同封装于文件头中。

其重要参数如下：

pic_parameter_set_id
声明当前PPS的id。
seq_parameter_set_id
声明当前PPS所引用的SPS的id。
entropy_coding_mode_flag
熵编码模式标识，表示码流中熵编码/解码选择的算法。等于0时表示熵编码使用CAVLC，等于1时表示熵编码使用CABAC。
num_slice_groups_minus1
表示某一帧中slice group的个数。当该值为0时，一帧中所有的slice都属于一个slice group。
num_ref_idx_l0_default_active_minus1
表示当Slice Header中的num_ref_idx_active_override_flag标识位为0时，P/SP/B slice的语法元素num_ref_idx_l0_active_minus1和num_ref_idx_l1_active_minus1的默认值。
weighted_pred_flag
标识位，表示在P/SP slice中是否开启加权预测。
weighted_bipred_idc
表示在B Slice中加权预测的方法，取值范围为[0,2]。0表示默认加权预测，1表示显式加权预测，2表示隐式加权预测。
pic_init_qp_minus26和pic_init_qs_minus26
表示初始的量化参数。实际的量化参数由该参数、slice header中的slice_qp_delta/slice_qs_delta计算得到。
chroma_qp_index_offset
用于计算色度分量的量化参数，取值范围为[-12,12]。
deblocking_filter_control_present_flag
标识位，用于表示Slice header中是否存在用于去块滤波器控制的信息。当该标志位为1时，slice header中包含去块滤波相应的信息；当该标识位为0时，slice header中没有相应的信息。
constrained_intra_pred_flag
若该标识为1，表示I宏块在进行帧内预测时只能使用来自I和SI类型宏块的信息；若该标识位0，表示I宏块可以使用来自Inter类型宏块的信息。
redundant_pic_cnt_present_flag
标识位，用于表示Slice header中是否存在redundant_pic_cnt语法元素。当该标志位为1时，slice header中包含redundant_pic_cnt；当该标识位为0时，slice header中没有相应的信息。

三、帧内分析

1、帧内编码帧

将文件读取的指针向后移动一帧，画面即出现，为整个文件的第一帧，也为第一个GOP的 I 帧。可看到所有宏块全部为 I 类型宏块，且其中有16×16宏块、8×8宏块和4×4宏块。其中8×8和4×4的宏块共有539个，16×16的宏块为381个。

将宏块显示打开后如图。

观察可以发现，在帧内预测帧（I 帧）中，其宏块类型与宏块当前所处位置的图像复杂度有关。更加细分的宏块，其更适用于较复杂的区域。将16×16宏块、8×8宏块和4×4宏块各取一个查看信息。

宏块类型	宏块信息
16×16
8×8
4×4

2、前向预测编码帧

向后逐帧跳转，到达第一个P帧后，查看此帧图像宏块信息。

不难看出P帧中宏块 大部分为 P 类型宏块（829/920） ，且P类型宏块中 16×16（349/829）类型和skip宏块（408/829）为最多 。原因应在于前后图像的变化不大，同时存在帧内编码宏块以弥补此帧相对于之前的 I 帧差异较大的细节部分。

其中与上述 I 帧内部宏块分为16×16、8×8、4×4宏块同理，此帧中还包含16×8的宏块。但此帧中发现了一个贼有意思的宏块，若未显示错误，此宏块是一个含有8×8和8×4的混合宏块。

此宏块的信息仍显示为8×8宏块。

3、双向预测内插编码帧

随机抽取一位幸运的 B 帧进行查看。

同样可看到帧内预测宏块 I 类型宏块的存在。同时， 大部分为双向预测帧编码类型的宏块（881/920） 。

同时，将此帧的运动向量进行显示。 ~~经历了几秒钟的程序未响应之后，~~ 可看到此 B 帧在进行块匹配过程中，运动向量的存在量很多，原因应在于画面的镜头一直摇晃的缘故。

若换一个仅有部分区域移动的视频序列，可看到运动向量的排布。（下图中运动向量均为红色，仅在人的区域出现，可以放大图片观看）

4、图像帧比特分析

使用 Elecard StreamEye Tools 软件打开mp4文件，可看到其所有的帧及其比特数全部在GUI界面中展示。

其中橙色的线为设置显示的帧比特数的平均值，即 视频序列的比特率 。红色的为 I 帧，蓝色为 P 帧，绿色为 B 帧。从图中就可看出，相对来说 B 帧要比 I 帧和 P 帧占用更小的比特数。而在视频开头，由于视频中开头部分镜头晃动较为明显，故P帧和B帧比特率并未低多少。

在上图中也可看到由于帧间预测，帧存在乱序，即 显示顺序与其在码流中的顺序不同 的情况。

将此视频序列的帧信息存入csv文件中，可看到码流顺序的帧排序。

考虑到第一个GOP开头部分由于镜头原因，比特数对比程度不大，故对第二个GOP中（第251 - 500个帧，下标为250 - 499）帧的比特数进行绘图。

参考与引用

[1]
[2]
[3]
[4]

本文标签：标识位类型宏块编程

版权声明：本文标题：H.264文件解析与码流分析_h.264 获取图片内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1774278723a3569895.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

H.264文件解析与码流分析_h.264 获取图片

概述

实验步骤

一、打开文件

二、文件信息分析

1、SPS信息

2、PPS信息

三、帧内分析

1、帧内编码帧

2、前向预测编码帧

3、双向预测内插编码帧

4、图像帧比特分析

参考与引用

更多相关文章

NTBOOTAutoFix：双系统启动菜单的终极修复大师

Ubuntu安装QQ为何总是闪退？探索问题，找到答案

奇怪的BUG：点击好友，QQ就关闭！

遭遇Ubuntu版QQ自动退出？跟着这3步轻松修复！

无线路由器桥接掉线？5个实用方案让网络流畅

从入门到精通：TP-Link与Netcore桥接实操指南

高效提升桥接稳定性：应对无线路由器掉线

192.168.0.127之谜：揭秘网络背后的精彩故事

轻松搞定192.168.0.1，从初学者到高手的路由器设置技巧

系统优化新纪元：Dism++ x64 2025最新版，Windows精简与C盘瘦身的终极攻略

告别重装系统，用DISM轻松解决电脑问题

从0到1：Dism++教你快速完成系统安装，新手必备技能！

Dism命令教程：Adobe Flash Player安装与维护的简便方法

彻底解决Dism修复Windows系统映像的困扰，轻松搞定！

优化高手必备：Dism++系统管理全解析

告别繁琐，Dism++一键卸载驱动，让电脑运行更流畅

CentOS系统备份攻略：避免数据丢失的不二法门

Adobe Flash Player的未来发展趋势预测

GHOST教程：系统备份和还原，小白也能变成高手！

一文教会你AIX系统备份：mksysb实用指南

发表评论

推荐文章

Word怎么删除空白页？6个方法随便用！_word删除空白页

显示桌面快捷方式的创建与使用

主板BIOS报警信号含义一览_主板两长两短报警

修复变砖IDE硬盘

Adobe Flash Player在Dx9与Dx10的兼容性大挑战：Flash中心的技术革新

热门文章

斐讯K2焕新颜，华硕固件让路由器性能大提升

Win11系统自动关机，怎么处理？

一文掌握：如何识别并清理掉Roaming文件夹中不必要的Adobe Flash Player数据

AirPods和电脑相连有干扰？一文教你排查及解决

什么是符号表、符号解析、符号重定位？_c语言什么叫动态符号表

修复无法打开的移动硬盘

LeagueAkari项目大乱斗随机英雄导致客户端闪退问题分析

告别传统器，这款“颜值实力派”开源神器，让你体验极致高速与优雅_类似motrix软件

修复移动硬盘回收站损坏

电脑屏幕护眼色设置指南

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑