算力利用率超90%!地平线推二代边缘芯片,详解AIoT落地综合打法
智东西(公众号:zhidxcom)
文 | 心缘
2019年,国内AI芯片玩家正围绕落地展开新一轮的冲刺。
一边是华为、百度、阿里等科技巨头和几家独角兽轮番秀出云端AI芯片新进展,另一边聚焦于边缘与终端的多家AI芯片创企陆续登场,揭开其第一代或者最新一代芯片的神秘面纱。
与此同时,人们评判AI芯片的标准,也由看算力、功耗等硬指标,转向看量产规模、看客户、看生态。
这不,国内AI芯片落地的排头兵地平线,刚刚亮出新剑!
今天上午,地平线推出第二代边缘AI芯片旭日二代和一站式全场景边缘AI芯片解决方案。其芯片等效算力达4Tops,典型功耗为2W,算力利用率超过90%,如果配合高效算法,在同等TOPS下可处理的帧数比GPU的10倍还多。
据悉,旭日一代已服务数百家客户,营收数亿,交付数十万套方案。
在此之前,地平线已经创造了多个记录:中国第一家AI芯片创企、发布中国首款边缘AI芯片、征程芯片登陆美国助力国际顶尖Robotaxi车队、旭日一代落地首年全球出货量达六位数、发布中国首款车规级AI芯片。今年3月,地平线宣布完成B轮6亿美元融资,估值达30亿美元,成为全球估值最高的AI芯片独角兽。
经过4年的积累,地平线在AIoT领域已经形成一套独特的打法。除了推出新品之外,今日地平线还聚焦于其AIoT产品的整体布局,展示其在芯片、整体方案、开放生态体系、落地能力等方面的核心优势,并公布其AIoT系列芯片的路线图。
AIoT时代面临哪些核心挑战?为什么今年AI芯片企业的势头有所衰减?如何在碎片化的AIoT市场中构筑竞争壁垒?会后,地平线联合创始人、技术副总裁黄畅,地平线副总裁、智能物联芯片方案产品线总经理张永谦,接受智东西等媒体的采访,就这些问题一一分享了他们的见解。
一、旭日二代:算力达 4Tops , 算力利用率超90%
旭日二代边缘AI芯片(以下简称“旭日二代”)面向智能物联网,具备强大的视频结构化能力,可对多类目标进行实施检测和精准识别,今年3月已完成流片,接近量产阶段。
该芯片采用台积电28nm工艺,面积不过14mm x 14mm,内置双核A53处理器和两个基于地平线第二代BPU架构(伯努利架构)的BPU。
BPU架构由地平线基于AI算法实际场景需求设计而成,以最大程度提升算力的有效利用率,同时保障芯片的前瞻性、迭代延续性。
旭日二代的等效算力达4Tops,典型功耗为2W,单路可实时处理4K@30fps,4路可实时处理1080P@30fps。地平线联合创始人、技术副总裁黄畅强调说,该芯片典型算法模型算力利用率超过90%,这在业界几乎是绝无仅有的。
如果配合高效算法,每TOPS算力可处理的帧数将高于标称4Tops算力的AI芯片,比同等算力GPU处理帧数的10倍还多。
在旭日二代上的实际测试结果表明,分类模型 MobileNet V2的运行速度超过每秒700张图片,检测模型Yolo V3的运行速度超过每秒40张图片。
针对物联网场景下的主要目标群体“人”和“车”,旭日二代进行了大量的算法优化,在边缘端即可实现全视频结构化能力,可高效灵活地处理多类AI任务,包括10~30万人前端识别,密集人群时空属性行为分析,多种非机动车、机动车检测分类。
前期客户验证表明,旭日二代可完全满足商业、办公、社区、园区、教育等物联网场景需求。
以通行门禁考勤方案为例,相较旭日一代,旭日二代芯片方案可将最大人脸库容从最快200ms提升至100ms,并由原本只支持安卓系统进化为支持安卓/Linux系统。
目前,旭日二代支持MXNet和TensorFlow框架,预计明年年初支持PyTorch。
黄畅向智东西介绍,地平线围绕其核心BPU定义一套自己的指令集,随着指令集的扩充,未来旭日芯片还将支持更多框架。
现场黄畅还透露了旭日系列芯片的路线图,旭日三代将于大约一年后推出,作为完整SoC方案,提供多种算力配置和多Camera输入支持,更好地整合多路的视频接入、视频处理、ISP、视频编辑码压缩等技术。
▲旭日系列芯片Roadmap
二、解读地平线 AIoT五大 优势
相比传统芯片大厂,地平线拥有更加开放的生态体系,落地能力也更加灵活高效,能大幅提升开发效率,并确保客户投资安全性。
总体来看,地平线AIoT有五方面的优势。
1 、软硬协同输出 极致效能
地平线率先提出,将世界领先的深度学习算法集成在自主研发的边缘AI处理器及平台上,通过软硬协同的方式将发挥效能优势发挥到极致。
经典芯片性能评估方式是PPA(功耗Power、性能Performance、面积Area),AI芯片真实性能常用Tops/W与Tops来呈现。
而黄畅认为,此类评估方式并不完全准确,AI芯片的真实性能应是能效、利用率、算法能力的乘积。这意味着不仅要对芯片和算法进行优化,还要对连接两者的编译器等中间环节进行优化,最终达成全面的优化。
以编译器优化所带来的利用率提升为例,即便有架构自动优化,有编译器相比没编译器的情况,单帧带宽消耗可从每帧141.9MB降到每帧34.4MB,单帧计算延迟可从43.77毫秒降到25.1毫秒,而计算资源利用率可从57%提升到95%。
黄畅介绍说,地平线充分考虑到未来重要应用场景的关键算法的计算特性,对趋势进行预判,前瞻性地将计算特点融入到计算架构设计中,使AI芯片随着芯片演进趋势,能始终保持相当高的有效利用率,从而真正意义上受益于算法创新带来的优势。
2 、完整的方案能力
地平线拥有丰富的算法样例模型,能够为客户提供以芯片+算法+工具链为核心的完整方案,满足多样化场景需求。
地平线提供完整开放的旭日芯片解决方案及“天工开物”芯片工具链,包括丰富的模型和应用示例、可视化性能分析工具、可快速上手的BPU API、高度灵活的HR Runtime API和Platform API,供客户根据需求选择。
这些工具链可提供可视化调试调优工具,协助开发者快速分析定位问题,还提供丰富的例子、文档,支持客户快速产品落地。
3 、开放的生态体系
基于边缘AI芯片,地平线致力于打造一个多层次、多维度、多样性的开放生态体系。
▲地平线开放赋能生态体系
在产业链赋能方面,地平线坚持底层技术能力研发,加速普惠AI时代到来;在开发者生态方面, 地平线通过工具链服务降低开发者门槛,助力上层应用产生,以此丰富整个AIoT应用生态。
此外, 地平线也正通过与行业开放社区合作的形式降低开发者门槛,比如地平线加入96Boards社区,并在前段时间,推出基于96Boards SOM规范的边缘AI开发套件BOOTPRINTX2,该套件具有高算力、高效能、感知接口丰富、可扩展的特点。
4 、 落地能力比同类型产品更灵活高效
地平线主打软硬协同,其芯片具有高MAC利用率,实际任务处理表现更好。
其芯片方案支持新模型优化,如 MobileNet、Faster RCNN。同等算力下,X2 在MobileNetV2之类的新模型上,比海思高端芯片(4Tops 算力)有更好的表现,实际性能更强,且功耗、成本更低。
另外,海思只支持Caffe,而地平线还支持更主流的训练框架TensorFlow。比如科达选择地平线很大程度上源于旭日二代芯片支持TensorFlow。
5 、在设备投入和运维上降低 成本
得益于边缘计算具有高度可靠、实时处理、灵活部署等特性,地平线可在两方面帮助客户降低成本。
一是设备投入,无需购置大型服务器或占用较大宽带网络。
二是设备运维,进行日常维护,更新迭代方便。
三、一站式全场景边缘 AI 芯片解决方案
随后,地平线副总裁、智能物联芯片方案产品线总经理张永谦发布旭日二代AI芯片及解决方案Horizon Hero,包括三类边缘AI芯片解决方案:地平线HeroSights智能摄像机解决方案、地平线HeroSpark通行门禁考勤方案、地平线HeroStream智能分析盒解决方案。
张永谦提到,AIoT产品化存在五点挑战:
(1)开发多种形态AI产品,满足不同场景需求;
(2)最好的智能与图像场景效果;
(3)快速开发上层智能应用;
(4)快速完成硬件设计;
(5)快速完成系统级整合。
针对这些挑战,地平线将解决方案从芯片、基础算法上推,使得客户可以更快、以更小投入、最低成本去快速完成产品化。相较于市场上的AI方案,Hero在以下方面拥有明显的落地优势:
1、边缘计算:本地端即可完成计算,数据无需上传到云端;
2、软硬结合:算法与芯片协同优化,使方案兼具高性能、低功耗特点;
3、端边结合:方案覆盖智能摄像机,面板机以及智能分析盒;
4、全场景一站式方案:完整解决方案支持客户快速应用开发和量产。
图像搭配语音,从像素级感知到时空语义建模,以“人”为本的Horizon Hero AI全场景能力集的全场景能力正在快速形成。
软件方面,地平线有非常强大的智能算法团队,提供了从最底层像素级的、最基础的原子的智能化处理,到语音识别、身份识别、人体属性分析,再到对人体感知时空的分析,有一整套完整的算法能力集。
针对客户不同的应用,地平线在算法集合的基础之上,还提供算法策略能力集,以缩短产品开发时间。
为了使客户能够快速地开发应用,地平线打造了端边一体AI嵌入式软件架构,只要在端的模块上加上算法配置和通道管理模块,就可以迅速形成边缘侧的软件架构。
其软件框架跨OS、AI全场景、模块化组件开发框架既支持安卓,也支持Linux,客户可在常用的几类端设备和边缘设备上快速集成他们的应用,这些应用也都具有很强的可复制性、可迁移性。
硬件方面,地平线提供完整硬件交付与参考设计,包括芯片、套件以及标准主板,同时地平线也提供完整的原理图和PCB Layout的设计。
地平线的芯片既单独向外销售,也通过整体解决方案的方式对外供给。如果客户想选择更熟悉的元器件,地平线也可以帮助他们在元器件上做整合和集成。
地平线还会提供整机智能效果集成支撑能力,包括模块化参考设计、结构与散热设计、原型机重现等。
这是因为光有核心设计仍不够,整体方案的效果还与光照、距离等外部因素有关,针对不同场景,地平线会提供多套不同的产品设计,并为客户集成各种他们需要的模块。
目前,地平线面向平安城市、智慧社区、智慧办公、智慧园区、智慧校园、智慧商业等六大行业提供解决方案。
四、数百家合作伙伴,营收数亿
据张永谦介绍,截至目前,旭日一代芯片已服务数百家客户,营收数亿,交付数十万套方案,实现线下场景服务数千万人口。
▲地平线在 AIoT 领域部分可公开合作伙伴
在地平线商业化加速过程中,有商米、多度、小米、永辉等许多优质客户落地案例。
智慧零售方面,基于地平线针对零售场景的AIoT芯片解决方案,商米推出了AI识客摄像机,可在本地端主动识别进店顾客并进行丰富的属性鉴别,解决商家“看店难”问题,助力精准营销。
智慧社区方面,基于“AI芯片+算法”的一站式AIoT解决方案,地平线与多度联合打造了智慧社区AI智能产品及解决方案。
除了视觉外,地平线在语音领域也有颇多建树,能提供包含麦克风阵列、信号处理、唤醒、语义理解、语音识别、语音合成的全链路解决方案。其语音方案在国内已拿下多个大单。
例如,智能家居方面,地平线为小米一系列语音交互智能设备,提供自主研发的增强语音抽取(Enhanced Speech Extraction,简称 ESE)方案,使得小米音箱在复杂的噪声环境中亦可实现随时打断、随时唤醒,交互体验更为精准、流畅。
地平线的方案将各个环节算法和芯片架构充分结合,通过端云结合,能在端侧更好地解决复杂场景中的语音处理问题。黄畅相信,很快地平线就可以在端上,拿出一个和服务器能够做到的性能相媲美的整套云链路,并将进一步在语音处理与视觉融合上发力。
五、AIoT应关注两个闭环,拼落地需要综合打法
会后,地平线联合创始人、副总裁黄畅,地平线副总裁、智能物联芯片方案产品线总经理张永谦,接受智东西等媒体的采访。
▲地平线副总裁、智能物联芯片方案产品线总经理张永谦(左),地平线联合创始人、副总裁黄畅(右)
在采访期间,黄畅和张永谦还多次强调,地平线不是单纯的芯片公司,而是通过“芯片+算法”的模式以挖掘更好的性能。相比其他方案,旭日二代芯片整个解决方案的价值最大化在于软件,芯片是技术能力中的重要基石,而在AIoT长尾应用领域的核心成本也是算法。
1、AIoT面临的两大挑战
谈及AIoT的挑战,黄畅认为,我们应该关注两个闭环,一是业务闭环,二是数据闭环。
在AIoT领域赋能传统行业时,很多困境来自缺乏开放性,对自我认知不足,对边界判定不清晰,导致各方无法专注于自身核心能力的打造。如果不能有效地构成业务闭环,就无法让信息进行流动联通。
数据闭环的难处来自于跨行业。传统行业往往很难将与业务场景强相关的数据分享出来,因此对于地平线这样关注基础AI能力建设的公司来说,能否持续去获取真实场景中的数据,经过不断迭代形成一个感知平台,广泛赋能各个业务场景中的一些基础AI任务,这个能力本身也非常重要。
2、真正落地需要一套综合打法
另外,今年的安防展中,AI芯片厂商身影似乎要比往年少。对于这一现象,黄畅并不觉得奇怪。
在他看来,AI芯片距离真正商业化落地还很遥远,过去两年,国内涌现一批造芯热潮,但其中一部分处于PPT造芯,自然今年的声势会弱下去。如今大家更注重落地,地平线也是如此,并不仅仅关注构造一个更加开放的边缘AI计算平台,同时也非常关注面向垂直领域的一站式解决方案。
要做到真正落地需要一套综合打法,是个动态切换、调整的过程。在这个过程中,地平线始终保持较为灵活的姿态和开放的态度,和产业界进行充分合作,根据客户需求进行自我调整。
黄畅表示,相信围绕地平线的核心能力,他们能够去创造价值、提高效率,从而反过来去证明自己共性的价值。
3、多种感知融合成提升交互体验的新趋势
既然自动驾驶AI芯片和视觉AIoT芯片都已推出第二代,那么地平线是否有涉足语音AI芯片的计划?
对此,黄畅告诉智东西,初期地平线曾考虑过这一问题,后来发现传统语音终端芯片中,现有的DSP 、Arm CPU等模块已经足够好,如果延续传统的语音算法,不认为自研处理器会有优势。
地平线看到的契机是通过更高的算力去显著提升语音交互的体验,通过不断将语音算法放到新架构上,从算法层面上加以改进。另外近几年呈现多种感知算法相互借鉴融合的趋势,其语音与图像的运算、处理的方式越来越趋同。
结语:从地平线看 AIoT 芯片落地三趋势
人工智能和机器学习的爆发,给边缘计算带来了巨大的机会。而地平线选择的自动驾驶和AIoT两条主线,前者被公认为代表人们出行的未来,后者更是广泛应用于人们生活的方方面面。
如今已进入AIoT芯片拼落地的时代,从地平线身上,我们可以看到当前AIoT芯片发展的几个趋势:
1、单芯片性能不再是唯一指标,软件成提升性能的关键手段,通过软硬协同最终带来整体性能提升。
2、芯片开发的易用性更受重视,打造芯片的同时,也通过搭配工具链等方式降低开发门槛。
3、AIoT芯片正走出只秀性能的固有模式,开始同落地紧密结合,提供更方便易用的一站式解决方案。
而这些趋势指向的同一目标,都是尽可能最大程度地方便开发者及企业的需求,通过提供更加开放的赋能服务,吸引更多合作伙伴,为自身生态建设奠定基础。
相关文章
-
AI金融交流群开放!周三将开讲《开源GPU数据科学平台RAPIDS在金融风险评估中的应用》
-
怎么关闭网吧的防火墙和杀毒软件
-
腾讯再次栽跟头!腾讯短视频“突围未果”,社交也救不了
-
【PW早报】新冠状病毒正式命名为“Covid-19”,疫苗可能在18个月内完成
-
利用创新模式打破数字鸿沟趣头条模式被点赞
-
华为手机怎么关闭锁屏广告
-
苏宁48亿元收购家乐福中国80%股份;重庆推出区块链政务服务平台|早8点档
-
唯品会股权曝光:腾讯京东共持股近16%超创始人沈亚
-
帮导购积累私域流量:百雀羚的抖音这么玩
-
张朝阳:搜狐归来 仍是人们生活中不可缺少的部分
-
小米与美图达成战略合作,将共同推出美图手机;刘强东风波后首次发声:京东管理稳定,我更关注新业务;天猫发公告:双 11 退货率仅 0.06
-
索尼董事长宣布退休,一文回顾平井一夫时代
-
Prisemi芯导解决方案PrisemiDiscreteOVPSolutionForRelianceJio-光与电子
-
人类历史上首张黑洞照片公布;京东回应大规模裁员8%:信息失实;腾讯或自研吃鸡游戏
-
热点丨法拉第未来:数百名休假员工暂时无法重返工作岗位
-
社群管家机器人可做哪些工作?社群助手好用吗?
-
不再赚小学生钱的腾讯,能否成为游戏防沉迷的引导者?
-
人类闯入禁区骷髅岛,眼前看到的,是从未见过的
-
罗永浩长文回应成为老赖,苹果申请环绕屏专利......
-
Netflix 不想交「苹果税」, 新用户不能在 iOS 端付费了
-
未来,你可能会主动点开这种广告
-
融媒体,“区”动力!全省首个XR沉浸式虚拟演播区在汉阳启用
-
银行内部人员告诉你,个人账户一次进账超这个数额,就会被风控
-
原有品总经理高自光晋升小米副总裁,分管中国区新零售
-
PyTorch终于能用上谷歌云TPU,推理性能提升4倍,我们该如何薅羊毛?
-
抖音的本质是复读机
-
黎万强的百台小米手机“乌龙抽奖”背后究竟还有什么好戏?
-
没弄明白直播前,求求甲方饶了主播们吧!
-
交通的可持续转型可在2050年前节省70万亿美元