用存算一体刷新智能驾驶大算力芯片

分享到:

存算一体技术最早提出是在20世纪70年代,但当时的主流是冯诺依曼中心计算架构。存算一体,简单解释是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法/加法运算,从而避免数据搬运产生的“存储墙”和“功耗墙”,极大提高数据的并行度和能量效率。随着近几年人工智能、云计算、自动驾驶等技术和应用的快速发展,存算一体成为解决在要求大算力、低功耗等终端设备上的关键技术。8月17日,在2022 IIC(国际集成电路展览会暨研讨会)上,后摩智能创始人& CEO吴强博士对存算一体在智能驾驶领域大算力芯片上的技术进行了分析。

吴强博士首先提出,‘’如何用存算一体刷新智能驾驶大算力芯片,里面有两个关键词,一个是存算一体,一个是智能驾驶大算力芯片。”

中国汽车产业百年大变局

中国汽车产业正在拥抱百年未有之大变局,未来可能超越欧洲和日本,成为与美国并驾齐驱的汽车强国,现在我们还只是一个汽车大国,还不是汽车强国。智能化是未来汽车发展的趋势。

 

bf4d9245c51ccf4b3b09b653523e576c

数据来源:汽车之家研究院、21世纪新汽车研究院《2022中国智能汽车发展趋势洞察报告》

上图是中国汽车智能化的销量和渗透率。2021年智能化是L2级,智能化渗透率在205%左右,2022年可以达到2530%左右,到2025年或接近50%。

智能驾驶芯片设计的挑战

智能驾驶普及落地需要有三个要素:

强智能。要足够的聪明,足够的智能,能把人解放出来,才能有价值。

2、安全性。反映到芯片有具体的要求,首先智能化需要大算力保证,然后还要低功耗,因为汽车是一个嵌入式设备,需要考虑功耗问题。

3、低成本。按照小米雷军的说法,大部分消费者购买的汽车在10-30万人民币之间,自动驾驶要足够便宜才能真正普及。

 

c490276460044d2212495babfd6f3fcb

从芯片设计角度要满足这些需求带来了很多挑战。

首先是是大算力

传统的汽车芯片是MCU,它是以控制为主,算力很小。但是现在的智能驾驶要求几十T、几百T到几千T的算力,L4级别则需要400T以上算力,L5级别需要1000T以上算力。现在最强云端算力是1000-2000T,所以汽车某种意义上来说是行走的超算中心。

怎么在边缘端做出这么大的算力呢?这就提出了很大的挑战。

第二个是低功耗

在云端电力很充足,有空调可以制冷,但是在汽车边缘端(车端)是通过电池供电有限,同时还有液冷散热的问题、成本方面的问题。这些都是面临的挑战。

既要大算力,又要低功耗,这是一对矛盾当前很难实现二者兼顾,特别是在汽车边缘端。

 

7b01f69ba4d9442765179d387f88d81d

存算一体技术解决大算力与低功耗的矛盾

存算一体,是在存储器中对数据进行运算,从而避免数据搬运产生的“存储墙”和“功耗墙”,极大提高数据的并行度和能量效率。

存算一体芯片技术的发展,恰恰既可以解决面临大算力要求,又能降低功耗的矛盾。因此,它有可能成为解决这些问题的一把金钥匙。

大部分传统的计算架构是冯诺依曼架构,优点是非常灵活,但是面对AI遇到的问题是出现算力瓶颈,同时存在大量数据搬运,所以带来很大的功耗消耗。如果存算一体融合在一起,在存储中做计算,这样既可以突破算力瓶颈,避免了大量的数据搬运带来的功耗问题,同时不依赖于先进工艺。

存算一体完美匹配了智能驾驶大算力需求。

以前做大算力芯片,从来没有考虑散热问题。自动驾驶出现以后,一个芯片动则几十瓦几百瓦,在车端,对散热提出了很高的要求。

散热有三种方式,自然风冷,风扇散热,液冷散热。

 

69ce553d02f899c0e87ac156c2839394

从成本上来说,自然风冷是最低的,可靠性也最高,维修成本也低;

风冷散热成本低,但是可靠性比较差,因为电扇很容易坏;

液冷可靠性较好,但是成本非常高。

所以自然散热是性价比最好的一种方式,成本低,非常可靠,维护成本也很低。

如果用传统的冯诺依曼架构来做大算力芯片,想保持自然风冷功耗在15W以内,按照目前的技术大概是15Tops,这样的算力只能做一些很简单的智能驾驶,比如说L1,L2级别,如果做L2+,L2++,L3则很吃力。

 

c9a168598168e4ac75097e3533ad1b31

如果用存算一体架构,则可能在15W自然风冷功耗之下做出60T甚至更高算力的芯片。

因此,存算一体技术解决了在低功耗下大算力的需求,这是存算一体可以给智能驾驶大算力带来的优势。

 

c97d21195917356d2f28e5bba91747e2

“这个是后摩智能的产品路线图,开始我们会用比较成熟的存储介质SRAM-based突破1000T,右边是我们下一代基于新型存储器的产品,比如MRAM,RRAM,可以突破2000T,这是为下一代智能汽车做准备。”吴强博士在分析了存算一体技术的优势后,介绍了后摩智能的产品规划。

存算一体,既涉及到硬件,更涉及到了AI下的机器学习、深度学习等软件算法。吴强博士谈到这方面时表示,“当然有好的芯片,还需要有好的软件,我们的芯片想办法尽可能用类CUDA的编程模式,降低客户应用的开发和迁移成本,这是我们设计软件的基本原则,另外还要兼容主流深度学习框架。针对这方面,我们搭了一个中间层,兼容上层常用的深度学习的应用框架,可以兼容我们自己的硬件,这样可以让客户更轻松实现无成本迁移。”

 

2ec3e1875975ac5ebf950d0ba3ae91ae

后摩智能的类CUDA的编程模式

此外,后摩智能的另一个特色是采用软硬解耦的思路,软件与硬件解耦,这样允许客户自定义算子,可以在很大程度上开放性定义自己的算子,定义算法,定义应用软件,这也是未来的发展趋势,是用开放的平台允许客户定义自己的算法。

后摩智能在20221年成功点亮了推出了业内第一款存算一体大算力AI芯片HMTC01。

 

07507bd120d38424ee3bb08386cb6aaf

这在业内第一次用存算一体严格存内计算技术做到了20T的算力(可扩展到200T+),它有足够多的算力,精度可以满足智能驾驶复杂AI场景的需求。在这个芯片上也跑通了智能驾驶常用的算法,完成了11个类别的检测、识别和语义分割。

总结

后摩当前主要聚焦在无人车/机器人以及乘用车自动驾驶,后期将延展到仿生机器人,包括AR/VR,云端推理,它们都有一个共同的特点:足够多的智能需要足够的算力和足够高的能效比的芯片。

分析了存算一体技术,介绍后摩智能在这方面的研发和深耕后,吴强博士进行了总结和展望,“后摩希望成为后摩尔时代打造算力基础的一家公司。在小型机时代是1k/W算力,PC时代是1G/W算力,未来到了万物互联时代,可能是1P/W算力,后摩愿景是希望用更多存算一体技术打造1P/W算力,追逐万物智能的梦想。”

 
继续阅读
用存算一体刷新智能驾驶大算力芯片

存算一体技术最早提出是在20世纪70年代,但当时的主流是冯诺依曼中心计算架构。存算一体,简单解释是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法/加法运算,从而避免数据搬运产生的“存储墙”和“功耗墙”,极大提高数据的并行度和能量效率。

到底什么是“算力网络”?

算力网络不是一项具体的技术,也不是一个具体的设备。从宏观来看,它是一种思想,一种理念。从微观来看,它仍然是一种网络,一种架构与性质完全不同的网络。

中国工程院院士张宏科:要抢占算力网络技术装备制高点

7月30日,中国工程院院士张宏科在2022中国算力大会上表示,网络技术和体系一直是近几年国内外研究的热点和重点,新型网络技术研究的目的,要满足自主可控。

算力发展未来还需迈过几道坎儿?

当前,数字经济正进入新发展阶段,算力作为数字时代核心资源的作用日益突出,以算力为核心的数字信息基础设施建设被提到前所未有的高度。

比亚迪拟自研智能驾驶芯片,欲强补智能化

补上智能化的短板,比亚迪选择从熟悉的领域入手。比亚迪正计划自主研发智能驾驶专用芯片,该项目由比亚迪半导体团队牵头,已经向设计公司发出需求,同时自身也在招募BSP技术团队。

精彩活动