B-Sports最近,英特尔推出了第二代神经拟态芯片Loihi2和用于神经启发应用程序的开源软件框架Lava。并且,Loihi2采用Intel4工艺的预生产版本制造。使用极紫外光刻技术简化布局设计规则,使得快速开发Loohi2成为可能。
在AI芯片方面,除了英特尔推出的神经拟态芯片,百度也在8月18日的百度世界大会上宣布第二代自研AI芯片——昆仑2正式量产。公布即量产,可以看出百度对于昆仑芯片的自信。
自1956年的Dartmouth学会上,人工智能的概念诞生。经过了半个多世纪的发展,麦卡锡提出的人工智能在机器人、语音识别、图像识别等领域都不断发展。而在人工智能发展的过程中,必然不会缺少的就是AI芯片。
目前对于AI芯片并没有明确的定义,广义上所有面向AI应用的芯片,包括训练和推理应用的芯片都可以称为AI芯片。
几乎所有的科技巨头都已开始布局,除了百度、英特尔两家企业,特斯拉也推出了号称全球算力最高的自研AI芯片。AI芯片行业巨头英伟达市值一度被推至5000亿以上。
2017年左右掀起了一轮新的AI热潮。AlphaGo战胜人类顶级棋手柯洁,横扫围棋界,一时间学界开始了又一轮的AI研究。
在最近三年级,AI芯片领域出现了两笔超级融资,壁仞科技在新创18个月就融资超过47亿元,创下国内芯片创业公司的最大融资记录。摩尔线程成立不到一年,估值超百亿,融资数十亿。
就单从2021年开年后看,AI芯片行业至少有20多起公开融资,而已公布的投融资金额及加起来,合计已达到约200亿人民币,其中有至少8起单笔融资的金额逾10亿人民币,单笔最高融资达53.5亿人民币。
致力于打造高性能GPU的沐曦集成电路有限公司8月27日宣布完成10亿元人民币A轮融资。
2021 年 1 月,燧原科技完成 18 亿人民币 C 轮融资。其实在去年 5 月,燧原科技就完成 7 亿人民币 B 轮融资,领投方为半导体产业基金武岳峰资本,老股东腾讯继续跟投。
2021年3月1日,云端服务器级的通用高性能计算芯片的天数智芯宣布完成C轮12亿元融资。
摩尔线天,即获深创投、红杉资本中国基金、GGV纪源资本等众多机构的青睐,融资金额已达数10亿。
可重构存算AI芯片的提出者千芯半导体(TensorChip)在3月22日公布完成了数千万人民币融资。
9月22日,黑芝麻智能宣布今年已经完成数亿美元的战略轮及C轮两轮融资。战略轮由小米长江产业基金、富赛汽车等国内产业龙头企业参与投资。
在深圳的墨芯人工智能,其自称是唯一拥有动态稀疏和静态稀疏技术的企业,在今年的1、3月份分别宣布获得新融资。
无论资本市场如何火热,检验AI芯片创企们长期发展实力的关键准则,最终会回归到产品实际性能和落地能力上来。
AI芯片已经进入肉搏期。相比起一度火热的概念潮,目前比拼的是谁能够率先落地产品、构建生态。
现在的问题成为了:进入了哪些场景?合作了哪些客户?有没有软硬一体化方案?是否已经有标杆案例?
AI芯片落地难的原因可能有很多个B-Sports。例如,神经网络中的卷积运算加速对于功耗的增加,当算力翻倍,除了硬件成本增加,电力供应和电费成本更是一个瓶颈。从芯片技术到算法理论的创新,是一个原因。
还有芯片研发速度小于AI语言的研发速度,当出现合适的芯片时,其采用的AI语言可能已经过时。这对于能否量产打出了一个问号。
Rokid北京AI实验室负责人高鹏在钛媒体的采访中说,“衡量一块芯片成功与否的标准,就是看它能否大规模的应用于产品。” 云知声创始人黄伟也曾表示:“我们的芯片是有客户的,不是PPT造芯,更不是自嗨。“
落地难更重要的原因还是在应用场景的设计。缺乏杀手级应用使得现有的AI芯片没有清晰的定位,无法高度优化PPA。支撑AI芯片的不仅仅是AI计算,更要面向场景,实现完整的功能。
“每个规格的芯片都有自己的特性,有些芯片非常便宜,性能就会差,无法支持诸如打断唤醒这种前端能力,这类芯片就适合高性价比产品;像 Rokid KAMINO18这样的AI 芯片,支持4麦阵列,就很适合智能音箱场景。”图灵机器人儿童事业部总监刘峰表示。
除去杀手级应用场景的缺乏,很多半导体投资人都表示,谁能在自己的产品赛道上率先突破生态,谁就能存活下来。
所谓的AI芯片生态指的是,芯片上整个软件栈来支持AI框架,而AI应用程序则是基于这些框架开发的。软件栈包括驱动程序、编译器、函数库、算字库、工具包等等,是实现高性能、高通用性、高易用性,以及针对不同应用场景深度优化的关键。
安谋中国AI技术高级市场经理吴彤曾表示,ASIC定制类的AI芯片会在未来的五到十年内成为市场上的主流,与此同时,AI芯片领域专用架构(DSA)也将开始流行。
针对不同的应用场景,客户的需求并不统一。一个可以商用的AI芯片除去自身芯片的研发,更多的时间还是花在了创造生态上。
在AI训练芯片领域,国际巨头英伟达一家独大,云端训练芯片上,很少有公司能够突破英伟达生态。在英伟达快速扩大中,生态成为了他的“护城河”。在2019年,云厂商亚马逊、谷歌、阿里巴巴中97.4%的人工智能加速器都部署了英伟达的图形处理器。
2018年,腾讯战略领投了燧原科技。燧原科技的通用AI训练芯片专为人工智能计算领域而设计,基于这种芯片的AI加速卡、燧原智能互联技术,以及“驭算”计算及编程平台可实现深度全栈集成,为编程人员提供针对性的加速AI计算B-Sports。
尺寸为57.5毫米×57.5毫米(面积为3306mm2),达到了芯片采用的日月光2.5D封装的极限,与上代产品一样采用格罗方德12nm工艺,单精度FP32算力为40TFLOPS,单精度张量TF32算力为160TFLOPS,整数精度INT8算力为320TOPS。
燧原产品的商业落地场景包括,液冷超大规模集群,加速视频内容生产;强大的视觉能力,保驾护航金融安全;边缘部署融合多数据,构建新型智能化交通;高效推理算力集群,建设园区AI视频云。
中科寒武纪,寒武纪科技的终端智能处理器IP主要产品有2016年推出的寒武纪1A处理器、2017年推出的寒武纪1H处理器、2018年推出的寒武纪1M处理器;云端智能芯片及加速卡产品有2018年推出的思元100、2019年推出的思元270、2021年初正式亮相的思元290;边缘智能芯片及加速卡为思元220,推出时间为2019年。
分别为终端智能处理器IP、云端智能芯片及加速卡、边缘智能芯片及加速卡,并为上述三个产品线所有产品研发了统一的基础系统软件平台(包含应用开发平台)——Cambricon Neuware软件开发平台(适用于其所有芯片与处理器产品)。
中星微,于 2016 年 6 月率先推出全球头先款具有深度学习能力的嵌入式神经网络处理器(NPU)人工智能芯片——“星光智能一号”,其后又于 2018 年推出运算速度提高 16 倍、功耗降低50%、适用场景更广的“星光智能二号”(NPU-II)人工智能芯片。
在今年9月的中关村论坛上,中星微发布了后摩尔时代下的新一代人工智能机器视觉芯片——“星光摩尔一号”。
“星光摩尔一号”是面向边缘计算的人工智能机器视觉芯片,可广泛应用于各类机器视觉边缘计算。支持800万像素的图像处理、视频编解码、安全加解密和异构智能计算,其视频编解码提供国标SVAC2.0与H.265两种格式的自由切换和转码,支持国标35114的A、B、C三种安全级别,提供4TOPS的深度学习峰值算力并支持多模融合智能计算框架。
地平线机器人(Horizon Robotics)。成立于 2015 年,总部在北京,创始人是前百度深度学习研究院负责人余凯。
地平线平台和Matrix SuperDrive整车智能解决方案,并将推出国内首个开源安全实时操作系统TogetherOS。9月15日,搭载了地平线芯片,科沃斯发布了最新一代扫地机器人地宝X1也成为了业内首款搭载AI专用芯片的扫地机器人。
除去扫地机器人芯片的使用,征程2则是商用落地的车规级AI芯片。该芯片现已应用于智能辅助驾驶、高级别自动驾驶、高精建图与定位,以及智能座舱等智能驾驶场景。基于软硬结合的创新设计理念,可提供4 TOPS等效算力,典型功耗仅2瓦;而且具有极高的算力有效性,每TOPS算力可达同等算力GPU的10倍以上。
灵汐科技,类脑芯片KA200入选2021年世界互联网突出科技成果“提名项目”。该系列产品可广泛应用于云端和边缘计算,满足众多传统人工智能企业的智能化升级需求,促进智慧城市、智能网联车等众多相关行业的发展和变革。
不仅能高效支持类脑计算模型和大规模脑仿真,为脑科学领域提供有利工具。同时,还可助力构建更大B-Sports、更快、更精准的功能级脑仿真平台,推动脑科学与类脑算法的研究和类脑生态构建。
计算机科学与脑科学融合的类脑芯片KA200,采用异构融合众核、存算一体的架构,单芯片集成25万神经元和2500万突触,每秒超过16万亿次突触计算,功耗近12瓦。KA200已经于2021年实现量产。
并且基于KA200构成了完整的产品体系,如类脑计算板卡、类脑计算模组、类脑服务器、软件工具链和系统软件以及类脑整体解决方案。
燧原科技面向云端训练,瞄准具体商业落地场景;寒武纪科技面向云、边、端三大场景研发了三种类型的芯片产品;中星微则布局嵌入式人工智能大规模商用,与AlphaGo这样高算力、高功耗的服务器端AI不同,嵌入式人工智能应用需要小型化、低功耗、低成本的芯片,星光智能二号完美地符合了这些需求,摄像头本身就具备AI边缘计算功能。
作为AI算力的主要应用场景,AI芯片在云端发展需要解决算力性价比与通用性问题。算力性价比决定了人工智能应用的部署成本,而算力通用性及软件生态决定着不同算法的迁移及开发成本。
在边缘和终端这一侧,AI芯片所面临的挑战是它们会被部署在各种各样的应用环境中。即便在同一个垂直场景里,也需要考虑不同模块之间的任务负载均衡问题。
赛灵思的单羿认为,FPGA因为有灵活可编程的优势,可以根据场景的持续需求调整这些模块之间的资源占用比例,从而达到全系统最优的效果。
地平线瞄准自动驾驶应用场景,在ADAS/自动驾驶应用场景下,AI芯片的核心价值就是实时处理行驶道路上的人、车、物等复杂环境的感知和决策。
目前,自动驾驶芯片在架构设计、研发投入与车规级应用等方面仍处于较为前期的探索过程中,特别是国产汽车芯片的市场份额还有待提升,因此,突破本土自动驾驶芯片技术的发展壁垒,将成为促进未来中国智能汽车产业发展的关键环节。
安防是目前最为明确的AI芯片应用场景,主要任务是视频结构化。摄像头终端加入AI芯片,可以实现实时响应、降低带宽压力。也可以将推理功能集成在边缘的服务器级产品中。
AI芯片要有视频处理和解码能力,主要考虑的是可处理的视频路数以及单路视频结构化的成本。
在AI芯片狂热的背后,越来越多的关注点转移到落地,中国的AI狂欢并不会持续太久。在“老大吃肉,老二喝汤”的半导体行业,AI芯片也具有这样的属性,每个产品线最后会跑出两三家公司。不过这是未来的格局,现在的AI芯片市场,很符合一句话:让子弹先飞一会。