谷歌让AI芯片学会“下崽”,下一代TPU就让AI自己设计

分享到:

设计一块AI芯片有多难?

这么说吧,围棋的复杂度10360,而芯片则是102500,你感受一下……

 

 

△围棋的复杂度

一般来说,工程师们设计一块芯片,少则需要几周,多则好几个月

现在,AI生产力来了!

AI自己动手,竟然用6小时就设计出一块芯片。

最近,这项谷歌的研究登上了Nature杂志。

 

 

小小的一块芯片包括了数十亿个晶体管,由它们组成的数千万个逻辑门就是标准单元,此外还有数千个存储块,称为宏块。

确定它们的位置,也就是布局规划,对芯片设计至关重要。

 

 

因为这直接关系到如何布线,进而影响着芯片的处理速度和电源效率。

但是,光是放置宏块这一步就非常耗时,为了给标准单元留出更多空间,每一次迭代都需要几天或几周时间。

 

 

△人类设计和AI设计芯片的平面图(灰色块为宏块)

完成整个布局,则要花费数周甚至数月

现在,谷歌的研究人员提出了一种具有泛化能力的芯片布局方法。

它能够基于深度强化学习,从之前的布局中进行学习,然后生成新的设计方案。整体结构是这样的:

 

 

由于AI模型需要学习10万个芯片布局,为了保证速度,研究人员设计了一种奖励机制,基于线路长度和布线拥塞的近似代价函数进行计算。

 

 

具体来说,需要将宏和标准单元映射到一个平面画布上,形成具有数百万到数十亿节点的「芯片网表」。

然后,AI模型会对功率、性能和面积(PPA) 等进行优化,并且输出概率分布。

下图分别是零样本生成和基于预训练策略微调的效果,其中每个小矩形代表一个宏块。在预训练策略中,中间留出了用于放置标准单元的空间。

 

 

与其他方法相比,谷歌的新方法大大减少了设计时间,只需不到6小时,就能实现性能优化的布局。

 

 

研究团队对不同策略下的布局效果进行了可视化展示,从图中可以看到,预训练策略微调的结果要明显优于零样本生成。

 

 

并且,从不同训练时长的效果对比可以看到,在训练2-12小时的情况下,预训练策略要优于零样本生成。

 

 

在不同规模的数据集上进行测试,研究人员发现,随着数据集规模的扩大,生成布局的质量和收敛时间的结果更优。

 

 

 

 

谷歌表示,

这一方法适用于任何类型的芯片。

目前已经被用于生产下一代Google TPU(加速器芯片)。

 

继续阅读
智慧城市的中场战事:用边缘AI撬动25万亿市场

2017年底时,麦肯锡全球研究院发布了一则《数字时代的中国:打造具有全球竞争力的新经济》报告,其中指明中国的数字化进程正在加快,例如2013年美国各个行业的数字化水平是中国的4.9倍,到2016年时已缩小到3.7倍。

鸿蒙已经起飞,但别忘了谷歌手里的牌不止安卓

2007年,苹果推出iOS和iPhone,全球迎来了移动互联网时代。随后,谷歌推出了开源的安卓系统,此后两位抢占了先机的互联网巨头就成为“移动生态系统”领域不可跨越的两座大山。

未来,比人类更强大的不是AI,而是掌握了AI的人类

目前,AI已在汽车、教育、医疗等领域深度赋能。比如在汽车领域,去年有近600万辆汽车安装了科大讯飞的智能语音系统,通过语音就可以直接和汽车对话,实现导航、听歌等功能,这在万物互联时代还会越来越普及。

为什么说好的AI训练数据平台对人工智能至关重要

人工智能技术正应用到各个行业当中,并对推动人类科技经济发展起着加速作用。麦肯锡全球研究所(McKinsey Global Institute)的一项预测显示,随着人工智能技术越来越成熟,能力越来越强,预计它将极大地推动世界经济,到2030年将创造约13万亿美元的附加价值。

谷歌用AI设计AI芯片,6小时完成工程师数月工作

6月11日消息,谷歌称其正在使用机器学习系统帮助工程师设计新一代机器学习芯片。谷歌工程师表示,算法设计的芯片质量和人工设计“相当”甚至“还要更好”,但完成速度要快得多。谷歌表示,人工智能可以在不到6小时的时间内完成人工需要数月时间完成的芯片设计工作。