必一运动的NPU,或者如华为这样自研NPU。蜂拥而起的AI造芯潮使得很多人认为在这个新兴的AI市场,已经丧失了先机,甚至有激进者认为Arm在这个即将爆发的人工智能市场将毫无建树。
在谈Arm的AI芯片布局之前,我们先来了解一下Arm以及当前的AI芯片现状。
如果统计处理器市场,特别是嵌入式处理器,Arm的IP是当中毫无疑问的大赢家。以大家熟悉的智能手机市场为例,无论是国际知名的苹果和三星,还是国内的华为、小米,他们使用的处理器无一例外都是基于Arm-Cortex-A系列IP设计。
再看,因为ST、NXP瑞萨的力拱,以及一众本土厂商的加入,Arm MCU的市场在过去多年里也节节攀升。关于Arm MCU的份额,并不能找到相关数据,但从Arm公司2017年的一份PPT中我们可以看到,物联网设备中,有90%的控制器都是基于Arm产品设计的,微控制器市场,Arm的份额也高达20%。如果统计整个带有处理器的芯片,则使用Arm相关IP的产品占比达到39%。
Arm在不同市场的份额和机会(source:Arm)此外,Arm还有GPU和DPU等一系列IP在市场上表现不错,这也帮助Arm获得了不错的市场份额。
据IP Nest的统计数据显示,整个IP市场2018年的总值为36.02亿美元,当中虽然Arm的份额连续第三年下滑,但是他们的占有率还是高达44.7%,遥遥领先于第二位。IP Nest在报告中还谈到,高端产品的授权转向了架构授权,而最低端的处理器则开始拥抱RISC-V。在2018年的IP市场里,还有一个值得关注的点,那就是机器学习和其他专用架构产品的兴起。
2018年的IP供应商排名回看过去几年的AI芯片发展,云端市场是GPU、ASICFPGA这些大规模芯片的自留地,这是大部分的芯片厂商所无法设计的,但在终端的推理市场,则百花盛开,百家争鸣。有厂商一开始就通过自研去步入这个领域(如苹果),在MCU市场,ST也推出了代号为Orlando Project的专用卷积神经网络加速器;有厂商则依靠第三方IP去进攻这个市场。这就催生了寒武纪和耐能一些新兴的NPU IP供应商,也让一些老牌厂商的产品在AI加速器这个市场寻找了新的机遇,如CEVACadenceTensilica)和Verisilicon就是当中的代表。
根据ABIRe-search预测,2024年,终端AI芯片市场规模将增长至710亿美元,2019年至2024年间的年复合增长率将达31%必一运动官方网站。考虑到AIoT市场的潜力,当中必然有相当大一部分营收来自于Arm MCU供应商。那就意味着如果Arm握不住这个市场,他们将会错失一大块蛋糕。甚至有可能在一些集成了RISC-V 与加速器的MCU的倒逼下,连本身领先的Cortex-M MCU城池也失守。
其实Arm NPU并不是什么新鲜事物。在文章开头我们已经说到,Arm在去年就推出了其Ethos N77/N57/N37系列NPU。Arm的这个家族的NPU是瞄准手机、AR/VR智能监控等市场。
Arm Ethos N77/N57/N37家族首先看手机市场,盘点现在的手机处理器厂商华为、高通、苹果、三星、MTK和展锐,除了展锐授权了Imagination的AI加速器之外之外,其他所有的厂商都是使用的自研NPU或者使用异构的硬件来做AI加速,当中的华为和MTK等NPU忠实玩家甚至都已经将其AI加速器推进到第三代。在这个发展过程中,他们也同步发展了其AI软件和生态,这就让他们没有任何理由转向Arm的加速器。上图的其他市场大多也有这种境况。
但在未来巨大的市场当中,还有一个目前还没有被大幅挖掘的金矿,那就是低功耗的终端应用。这也是Arm Ethos U55所瞄准的目标。而据行业的专家告诉半导体行业观察记者,AI加速器能否应用到超低功耗的物联网市场,首先要关注的一点就是它的功耗表现,这也是Arm在致力于解决的。
日前发布的Ethos U55 和与之搭配的Cortex-M55则是Arm在这个市场的小试牛刀。
Arm为终端AI带来的全新方案Arm的官方表示,新增的Cortex-M55是Arm历来AI能力最为强大的Cortex-M处理器,也是首款基于Armv8.1-M架构、内建Arm Helium向量处理技术的处理器,它可以大幅提升DSP与ML的性能,同时更省电。Arm同时指出,在这个新的处理器上,客户可以使用Arm Custom Instructions (Arm自定义指令集)延伸处理器的能力,对特定工作负载进行优化。来到Ethos-U55,这是一个可从32个MAC扩展到256个MAC的micro NPU,在与Cortex-M55耦合之后,能够为微控制器带来480倍的机器学习性能飞跃。
Arm方面还强调,这个全新搭配还得到了Cortex-M软件开发工具链的支持,这就使得其针对传统DSP与ML等工作负载,有了一致的开发流程;同时从TensorFlowLite Micro开始,能针对先进机器学习框架进行特定的整合与优化,确保开发人员拥有无缝的开发体验,并能够在任何一种Cortex-M与Ethos-U55的配置上,获取最佳性能。
Arm首款microNPU业内专家也告诉半导体行业观察记者,考虑到Arm当前的地位和名声,这套方案带给市场的影响是显而易见的。Cortex-M方面自不用多说,这是他们在嵌入式市场安身立命的重要武器。而来到NPU方面,也同样亮点不少。一方面,这是一个带两级SRAM,L2 SRAM可扩展到数MB的产品;另一方面,Ethos-U55自带DMA+control unit, 可完成异步数据流管理;第三,Ethos-U55的Weight Decoder可将神经网络中的weights进行压缩,提高带宽;第四,这个NPU还有针对element wise运算的特殊加速单元,能帮助矩阵运算。
“还有一点,Arm CMSIS-NN所积聚的生态,也会是一个重要的X因素”,业内专家强调。
CMSIS-NN的框架图行业专家表示,在Arm刚推出这个库的时候,彼时的Arm Cortex-M还不能跑出让人眼前一亮的结果。但因为Arm强大的号召力,即使很多厂商并不知道它的真正用途,但都纷纷将其融入了其OS和生态里。
也许Arm的想法是这样的——我们有足够多的MCU客户,有足够多终端用户必一运动官方网站,过去的十几年里,我们也构建了无可比拟的生态,只要我们把这套工具磨利,就能让大家投奔我门下,让Arm在嵌入式AI领域重现Cortex-A和Cortex-M时代的辉煌。
我们可以看到,无论是Cortex-A所支持的AP或者是Cortex-M所驱动的MCU生态,他们所面对的都是相对单一的需求。换而言之打造一些通用化的方案就能通吃市场。但进入了当前的AIoT市场,市场需求千差万别,定制化或者会更为一股重要的趋势,这也是Arm Custom Instructions面世的原因之一。
首先,以大家过去一两年常谈的RISC-V为例,因为其独特的开源特性和成本优势,很多分析人士都认为其可以在AIoT时代大展拳脚。而在最近,RISC-V的领先厂商SiFive也宣布,将携手IP厂商CEVA,在CPU、DSP、AI处理器和软件方面进行合作,帮助芯片企业开发出大批量面向智能家居、汽车、机器人、安保、增强现实、工业和物联等一系列边缘智能SoC。在官方新闻稿里,他们也强调了面向特定领域的超低功耗Edge AI处理器,这正是Arm新产品所聚焦的。
其次,Lattice这些小容量FPGA供应商,也无限看好这个市场。Lattice方面表示,基于他们的Lattice sensAI可以帮助OEM厂商为下一代毫瓦级智能设备赋予AI和ML功能。对于Arm阵型来说,这也是一个潜在的挑战者。
第三,类似Greenwaves这些初创企业,也成为嵌入式AI市场的一个不确定因素。资料显示,他们最新推出的GAP 9可提供41.6 GB /秒的峰值群集内存带宽和高达50 GOPS的组合计算能力,而总功耗仅仅为50mW,再搭配其完整的工具,这也成为了嵌入式AI市场一股不可忽视的势力。
第四,在Arm芯片阵型里,有一些大客户在研发自己的加速器方案,如瑞萨的动态可配置处理器 (DRP) 技术就是当中一个代表。再搭配其SOTB制程来降低功耗,这就让日本巨头的嵌入式AI方案变得非常有竞争力。
最后,Arm的嵌入式AI方案是否真的能如他们所说,减轻了很多客户的开发工作?这是一个值得推敲的问题。行业专家表示,在嵌入式AI这个领域,其实大家在软件开发上面的难度差不多,迄今为止也没有人能建立其一个很强大的生态。
而对于那些购买了Arm NPU IP的人,他们除了需要面对数据搬运的挑战外,还要直面是否有完整的工具,能很好帮助他们完成模型训练到片上移植的过程。最重要的一点,Arm的这些新IP授权费用怎么收?这也是一个重要考量点。但即使如此,Arm也迈开了嵌入式AI市场的一大步。
从分析师预测看来,AIoT是发展的必然趋势,这也是一个多个阵营虎视眈眈,但谁都没有把握稳赢的市场必一运动官方网站。作为一个拥用强大的生态合作伙伴的Arm,能否凭借新产品成为这个赛道的领跑者,尚待观察。但对他们来说,这关键一战的冲锋号已经吹响。
模型时报错,该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32
进展,谁将领跑未来? /
用户的语音、文字和情绪等信息,并给出针对性的应答,与传统的人工处理相比,
智能呼叫中心能够实现24/7不间断的服务,大幅提高了处理效率和用户满意度。二、个性化服务
(Artificial Intelligence chips)是特别设计用于处理人工智能(
加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。
加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。
公司都在低端市场里杀价。当客户有多个供应商时,就会变得尤其挑剔。“为什么XX竞品没有问题,你们的
【Vision Board创客营连载体验】RT-Thread 之wifi连网