首页编程正文内容

_rendernode背后的故事：揭秘Android中实现高效视觉效果的关键

编程

更新时间：2026-04-03 21:06:37 20

admin 管理员组

文章数量: 1184232

一　概述

在手机客户端尤其是 Android 应用开发过程中，我们经常会接触到“硬件加速”这个概念。由于操作系统对底层软硬件封装非常完善，上层软件开发者往往对硬件加速的底层原理了解很少，也不清楚了解底层原理的意义，因此常会有一些误解，如硬件加速是不是通过特殊算法实现页面渲染加速，或是通过硬件提高 CPU/GPU 运算速率实现渲染加速。

硬件加速，直观上说就是依赖 GPU 实现图形绘制加速，软硬件加速的区别主要是图形的绘制究竟是 GPU 来处理还是 CPU，如果是 GPU，就认为是硬件加速绘制，反之，则为软件绘制。在 Android 中也是如此，不过相对于普通的软件绘制，硬件加速还做了其他方面优化，不仅仅限定在绘制方面，绘制之前，在如何构建绘制区域上，硬件加速也做出了很大优化，因此硬件加速特性可以从下面两部分来分析：

前期策略：如何构建需要绘制的区域
后期绘制：单独渲染线程，依赖 GPU 进行绘制

无论是软件绘制还是硬件加速，绘制内存的分配都是类似的，都是需要请求 SurfaceFlinger 服务分配一块内存，只不过硬件加速有可能从 FrameBuffer 硬件缓冲区直接分配内存（SurfaceFlinger 一直这么干的），两者的绘制都是在 APP 端，绘制完成之后同样需要通知 SurfaceFlinger 进行合成，在这个流程上没有任何区别， 真正的区别在于在 APP 端如何完成 UI 数据绘制 ，本文就直观的了解下两者的区别，会涉及部分源码，但不求甚解。

1.1 了解硬件加速对App开发的意义

对于 App 开发者，简单了解硬件加速原理及上层 API 实现，开发时就可以充分利用硬件加速提高页面的性能。以 Android 举例，实现一个圆角矩形按钮通常有两种方案：使用 PNG 图片；使用代码（XML/Java）实现。简单对比两种方案如下。

方案	原理	特点
使用PNG图片（BitmapDrawable）	解码PNG图片生成Bitmap，传到底层，由GPU渲染	图片解码消耗CPU运算资源，Bitmap占用内存大，绘制慢
使用XML或Java代码实现（ShapeDrawable）	直接将Shape信息传到底层，由GPU渲染	消耗CPU资源少，占用内存小，绘制快

1.2 页面渲染背景知识

页面渲染时，被绘制的元素最终要转换成矩阵像素点（即多维数组形式，类似安卓中的 Bitmap），才能被显示器显示
页面由各种基本元素组成，例如圆形、圆角矩形、线段、文字、矢量图（常用贝塞尔曲线组成）、Bitmap 等
元素绘制时尤其是动画绘制过程中，经常涉及插值、缩放、旋转、透明度变化、动画过渡、毛玻璃模糊，甚至包括 3D 变换、物理运动（例如游戏中常见的抛物线运动）、多媒体文件解码（主要在桌面机中有应用，移动设备一般不用 GPU 做解码）等运算
绘制过程经常需要进行逻辑较简单、但数据量庞大的浮点运算。

二　CPU与GPU结构对比

CPU（Central Processing Unit，中央处理器）是计算机设备的核心器件，用于执行程序代码，软件开发者对此都很熟悉；GPU（Graphics Processing Unit，图形处理器）主要用于处理图形运算，通常所说“显卡”的核心部件就是 GPU。

下面是 CPU 和 GPU 的结构对比图。其中：

黄色的 Control 为控制器，用于协调控制整个 CPU 的运行，包括取出指令、控制其他模块的运行等；
绿色的 ALU（Arithmetic Logic Unit）是算术逻辑单元，用于进行数学、逻辑运算；
橙色的 Cache 和 DRAM 分别为缓存和 RAM，用于存储信息。

从结构图可以看出，CPU 的控制器较为复杂，而 ALU 数量较少。因此 CPU 擅长各种复杂的逻辑运算，但不擅长数学尤其是浮点运算。

以 8086 为例，一百多条汇编指令大部分都是逻辑指令，数学计算相关的主要是 16 位加减乘除和移位运算。一次整型和逻辑运算一般需要 1~3 个机器周期，而浮点运算要转换成整数计算，一次运算可能消耗上百个机器周期
更简单的 CPU 甚至只有加法指令，减法用补码加法实现，乘法用累加实现，除法用减法循环实现
现代 CPU 一般都带有硬件浮点运算器（FPU），但主要适用于数据量不大的情况

CPU 是串行结构。以计算 100 个数字为例，对于 CPU 的一个核，每次只能计算两个数的和，结果逐步累加。

和 CPU 不同的是，GPU 就是为实现大量数学运算设计的。从结构图中可以看到，GPU 的控制器比较简单，但包含了大量 ALU。GPU 中的 ALU 使用了并行设计，且具有较多浮点运算单元。

硬件加速的主要原理，就是通过底层软件代码，将 CPU 不擅长的图形计算转换成 GPU 专用指令，由 GPU 完成。

扩展：很多计算机中的 GPU 有自己独立的显存；没有独立显存则使用共享内存的形式，从内存中划分一块区域作为显存。显存可以保存 GPU 指令等信息。

2.1 并行结构举例：级联加法器

为了方便理解，这里先从底层电路结构的角度举一个例子。如下图为一个加法器，对应实际的数字电路结构。

A、B 为输入，C 为输出，且 A、B、C 均为总线，以 32 位 CPU 为例，则每根总线实际由 32 根导线组成，每根导线用不同的电压表示一个二进制的 0 或 1。

Clock 为时钟信号线，每个固定的时钟周期可向其输入一个特定的电压信号，每当一个时钟信号到来时，A 和 B 的和就会输出到 C。

现在我们要计算 8 个整数的和。

对于 CPU 这种串行结构，代码编写很简单，用 for 循环把所有数字逐个相加即可。串行结构只有一个加法器，需要 7 次求和运算；每次计算完部分和，还要将其再转移到加法器的输入端，做下一次计算。整个过程至少要消耗十几个机器周期。

而对于并行结构，一种常见的设计是级联加法器，如下图，其中所有的 clock 连在一起。当需要相加的 8 个数据在输入端 A1~B4 准备好后，经过三个时钟周期，求和操作就完成了。如果数据量更大、级联的层级更大，则并行结构的优势更明显。

由于电路的限制，不容易通过提高时钟频率、减小时钟周期的方式提高运算速度。并行结构通过增加电路规模、并行处理，来实现更快的运算。但并行结构不容易实现复杂逻辑，因为同时考虑多个支路的输出结果，并协调同步处理的过程很复杂（有点像多线程编程）。

2.2 GPU并行计算举例

假设我们有如下图像处理任务，给每个像素值加 1。GPU 并行计算的方式简单粗暴，在资源允许的情况下，可以为每个像素开一个 GPU 线程，由其进行加 1 操作。数学运算量越大，这种并行方式性能优势越明显。

三　软硬件加速的分歧点

大概从 Android 4.+ 开始，默认情况下都是支持和开启了硬件加速的，也存在手机支持硬件加速，但是部分 API 不支持硬件加速的情况，如果使用了这些 API，就需要主动关闭硬件加速，或者在 View 层，或者在 Activity 层关闭，比如 Canvas 的 clipPath 等。但是，View 的绘制是软件实现的还是硬件加速实现的，一般在开发的时候并不可见，那么图形绘制的时候，软硬件的分歧点究竟在哪呢？举个例子，有个 View 需要重绘，一般会调用 View 的 invalidate，触发重绘，跟着这条线走，去查一下分歧点。

从上面的调用流程可以看出，视图重绘最后会进入 ViewRootImpl 的 draw，软硬件加速的分歧点就在这个函数里面 ，我们来看代码：

ViewRootImpl.java

privatevoiddraw(boolean fullRedrawNeeded){
   
   ......if(!dirty.isEmpty()|| mIsAnimating || accessibilityFocusDirty){
   
   <!--关键点1 是否开启硬件加速-->if(mAttachInfo.mThreadedRenderer != null &&
            mAttachInfo.mThreadedRenderer.isEnabled()){
   
   ......
            dirty.setEmpty();<!--关键点2 硬件加速绘制-->
            mAttachInfo.mThreadedRenderer.draw(mView, mAttachInfo,this);}else{
   
   ...<!--关键点3 软件绘制-->if(!drawSoftware(surface, mAttachInfo, xOffset, yOffset,
                scalingRequired, dirty, surfaceInsets)){
   
   returnfalse;}......

关键点1是启用硬件加速的条件，必须支持硬件并且开启了硬件加速才可以，满足这两个条件后，就调用 ThreadedRenderer.draw，否则 drawSoftware（软件绘制）。简答看一下这个条件，默认情况下，该条件是成立的，因为 4.+ 之后的手机一般都支持硬件加速，而且在 ViewRootImpl 通过 setView 添加窗口的时候，会调用 enableHardwareAcceleration 开启硬件加速，我们来看代码：

ViewRootImpl.java

publicvoidsetView(View view, WindowManager.LayoutParams attrs, View panelParentView){
   
   ......if(view instanceofRootViewSurfaceTaker){
   
   
         mSurfaceHolderCallback =((RootViewSurfaceTaker)view).willYouTakeTheSurface();if(mSurfaceHolderCallback != null){
   
   
              mSurfaceHolder =newTakenSurfaceHolder();
              mSurfaceHolder.setFormat(PixelFormat.UNKNOWN);
              mSurfaceHolder.addCallback(mSurfaceHolderCallback);}}......if(mSurfaceHolder == null){
   
   // While this is supposed to enable only, it can effectively disable// the acceleration too.//关键点： 开启硬件加速enableHardwareAcceleration(attrs);finalboolean useMTRenderer = MT_RENDERER_AVAILABLE
               && mAttachInfo.mThreadedRenderer != null;if(mUseMTRenderer != useMTRenderer){
   
   // Shouldn't be resizing, as it's done only in window setup,// but end just in case.endDragResizing();
            mUseMTRenderer = useMTRenderer;

本文标签：硬件加速关键点编程

版权声明：本文标题：_rendernode背后的故事：揭秘Android中实现高效视觉效果的关键内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1771858489a3549354.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

_rendernode背后的故事：揭秘Android中实现高效视觉效果的关键

一 概述

1.1 了解硬件加速对App开发的意义

1.2 页面渲染背景知识

二 CPU与GPU结构对比

2.1 并行结构举例：级联加法器

2.2 GPU并行计算举例

三 软硬件加速的分歧点

更多相关文章

好友一碰就消失？揭秘QQ自动退出的神秘原因

Ubuntu 下的QQ烦恼？一招搞定自动退出的小技巧

从入门到精通：TP-Link与Netcore桥接实操指南

网络优化新方案：探索TPLink与Netcore路由器的桥接模式

TP-Link 478+ 升级秘密武器：高效固件包等你来下载！

192.168.0.1隐藏的路由器入口，教你快速进入并优化网络！

192.168.1.1与FTP服务器连接问题？一文帮你搞定！

从192.168.1.1开始：Adobe Flash Player官方入口的全面解读

从0到1：Dism++教你快速完成系统安装，新手必备技能！

Windows系统维护新纪元：Dism命令的高效应用实践

Dism命令教程：Adobe Flash Player安装与维护的简便方法

揭秘Dism日志：解锁Windows系统维护的终极武器

告别系统崩溃，通过DISM工具让电脑重获新生

解锁Dism命令的强大功能：为你的Adobe Flash Player添翼

告别Flash播放器错误，用DISM轻松搞定

Dism日志入门：轻松掌握Windows系统维护技巧！

当Windows系统出问题时，如何借助DISM挂载映像进行修复，让电脑焕然一新？

CentOS系统备份攻略：避免数据丢失的不二法门

Adobe Flash Player的未来发展趋势预测

一文教会你AIX系统备份：mksysb实用指南

发表评论

推荐文章

WiFi宝、WiFi共享精灵 vs 无线网卡：解锁网络连接的秘密

QQ&TIM提权漏洞分析_qq漏洞

QQ中之前自己上传到收藏的表情包_qq收藏表情包配置文件

[博应用软件]如何正确安装路由器？_路由器怎么安.

显示器不亮？解决“显示器不支持当前的输入时序，请将输入时序更改为 1920x1080, 60Hz”的终极指南_显示器不支持当前的输入时序 请将时序更改为1920*1080

热门文章

Windows新手快上手：Adobe Flash Player操作指南与实践

电脑玩游戏卡？学会这3招，让你告别卡顿，享受流畅游戏时光！

xp系统里把笔记本变成无线路由

access2007设置用户与工作组的管理与权限_access2007工作组管理员

解决主板不支持U盘启动的七大策略

C# 以MDF文件连接数据库_c++ mdf文件解析

一个移动光猫能连几个路由器？_一个光猫可以接几个路由器

解决Windows中应用程序找不到X3DAudio1_7.dll文件的问题_x3daudio17dll丢失是什么原因

WiFi满格不等于网速快！找出拖慢网速的罪魁祸首，一键提速不是梦！

Dism++：让你的电脑焕然一新，快速提升性能，告别延迟！

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑

一　概述

二　CPU与GPU结构对比

三　软硬件加速的分歧点

显示器不亮？解决“显示器不支持当前的输入时序，请将输入时序更改为 1920x1080, 60Hz”的终极指南_显示器不支持当前的输入时序请将时序更改为1920*1080