Oculus为Quest推出两款全新GPU性能开发工具
来源:映维网 作者 黄颜
Oculus和高通在过去一年中一直在努力构建一个名为Performance Interface Library(PIL)的底层设备端库,从而提供以前只能通过Snapdragon Profiler获得的GPU信息。这个库现在已经嵌入到Quest操作系统中,并提供了两种主要的信息:渲染阶段度量和实时度量。你可以通过GPU Systrace和ovrgpuprofiler这两个新工具进行访问,以最少的GPU开销来探其所为。
1. GPU Systrace
对于大多数现有的GPU工具,一个核心问题是它们将时间测量作为绘制调用序列,而移动GPU将一个接一个地渲染曲面图元。你无法查询图片时间和信息,因为图元是在图形API之下抽象出来。然而,PIL为我们提供了一种查询所有相关数据的方法,能够有效地告诉我们“GPU渲染了一个1216×1344的曲面,其中96个图元的大小都是192×168,耗时5.2ms。”
GPU Systrace将渲染阶段信息集成到Systrace中,从而提供了更佳的可视化体验,并允许你在同一视图中查看GPU负载和CPU负载。通过这样的方式,你就可以探知应用程序的CPU负载和GPU负载是如何协同工作。
VrCubeworld 示例规矩输出(须用Chrome浏览器)
在上面的屏幕截图中,你可以在顶行看到GPU渲染曲面的进程,而CPU进程则在底行呈现。在GPU完成渲染曲面后不久,CPU等待操作(FenceChecker::wait)就会释放。另外,GPU曲面渲染过程会划分为一系列的渲染阶段。Binning是指计算所有绘制调用的三角形顶点位置并将其分配给对应于绘制曲面分区的bin。Render表示一个bin的所有顶点和片段操作的总成本。Preempt是合成器,一个操作系统级的服务,它定期执行并将应用程序提交的图像显示在屏幕。有关工具提供的GPU信息的完整列表,请参阅这个GPU Systrace文档。
2. Ovrgpuprofiler Tool
Ovrgpuprofiler是Oculus Quest的一个底层CLI工具,主要用于提供对详细GPU信息的访问。它构建成一个超轻量级的CLI客户端,并有效地充当PIL-Qualcomm库之上的wrapper。它允许你检索两种类型的信息,渲染阶段度量(类似GPU systrace,但只是文本形式)和实时度量。它的主要目标是成为一个易于使用的低摩擦工具,因为它可以直接通过adb shell提供。
在adb shell提示符中,ovrgpuprofiler-m将显示工具支持的所有实时指数列表,前几个结果是:
monterey:/ # ovrgpuprofiler -m
47 metrics supported:
1 Clocks / Second
2 GPU % Bus Busy
3 % Vertex Fetch Stall
4 % Texture Fetch Stall
5 L1 Texture Cache Miss Per Pixel
例如,如果用户希望要检索度量值3和5,用户需要调用ovrgpuprofiler–realtime=“3,5”,它将每秒返回采样的度量值:
monterey:/ # ovrgpuprofiler –realtime=”3,5”
% Vertex Fetch Stall : 1.057
L1 Texture Cache Miss Per Pixel : 0.166
% Vertex Fetch Stall : 1.082
L1 Texture Cache Miss Per Pixel : 0.166
要查询renderstage数据,在调用ovrgpuprofiler-e并重启应用(这是将应用的GPU情景置于分析模式所必需的动作,与GPU Systrace完全相同)之后,对ovrgpuprofiler-t的调用将返回如下信息:
Surface 1 | 1216×1344 | color 32bit, depth 24bit, stencil 0 bit, MSAA 4 | 60 128×224 bins | 5.12 ms | 123 stages : Binning : 0.643ms Render : 2.17ms StoreColor : 0.474ms Blit : 0.002ms Preempt : 1.411ms
渲染阶段数据允许我们回答这样的问题:“我的应用实际需要多长时间完成计算,其中有多少是时间扭曲?”
我们从数据中可以看到,它需要5.12毫秒来执行,其中1.411毫秒是时间扭曲。现在,你已经拥有了为应用做出明智选择所需的一切信息。
3. 总结
有关PIL、ovrgpuprofiler和GPU Systrace的更多信息,请查看GPU Systrace文档 和ovrgpuprofiler文档 。
需要注意的是,这个库和附带工具正在开发之中,而Oculus计划在不久的将来添加更多的信息和功能,如绘制调用度量和其他渲染阶段。Oculus同时注意到Vulkan的一个问题:在使用渲染阶段跟踪时会造成不必要的CPU等待。
相关文章
-
发表论文都要钱吗?
-
腾讯旗下产品"死亡"名单:39款上榜停运或淘汰最短命的仅上线10h
-
焦点分析|互联网券商是一门好生意吗?
-
不仅教人穿衣服,还要给人换衣服:这两篇ICCV论文出自同一人
-
帮导购积累私域流量:百雀羚的抖音这么玩
-
奥密克戎未来会怎么传播?张文宏最新研判
-
视频社交的“多闪”,是 90 后产品经理的微信梦么?
-
企鹅号视频怎么消重vegas如何去视频中的水印
-
POE交换机IEC62368标准的CB认证流程和资料
-
Lyft宣布裁员982人在员工总数中占17%
-
特斯拉给员工发布邮件:如果你泄密,我们会抓住你,解雇你,可能会起诉你
-
让“本地人”做旅游计划, 自由行定制平台“小驴帮”想在OTA的市场边缘再创新
-
最强CNN语音识别算法开源了:词错率5%,训练超快,Facebook出品
-
网易云音乐融资后:存量红利时代如何破局?
-
现在,很多年轻达人都用它喝出“豆浆瘦”!
-
消失半年后回归?咪蒙疑弃文投身短视频领域,掘金四千亿美妆市场
-
PEGSuccinicAcid-PEG-SuccinicAcid,SuccinicAcid-PEG-SA含有丁二酸的PEG
-
热点丨网约车第一股Lyft上市首日收涨逾8%市值226亿美元
-
近期苹果、Facebook等科技巨头股价缘何不断下跌?
-
新春献词丨期待每一个闪闪发光的日子
-
一代大神,栽在了自己的纪录片手里?
-
【PW早报】苹果供应商博通公开表示:iPhone12系列或推迟到第四季度发布
-
B端设计:盘点筛选控件的基本知识
-
大数据开发之HDFS分布式文件存储系统详解
-
个人征信查询官网入口:手机上怎么免费查询个人征信报告方法教程
-
揭秘营销艺术家TCL张晓光的大国品牌价值观营销之道
-
旧貌换新颜!iOS版QQ更新8.0,新增语音消息进度条
-
滴滴外卖“生死劫”
-
【钛晨报】百度否认退市,正在研讨赴港二次上市;全球供应链TOP25发布,中国仅阿里和联想上榜;小米1.03亿美元收购紫米