从谷歌AI设计芯片上,我们看到了“智能”的本质



在上周发表于同行评审科学杂志《自然》中的论文里,Google Brain团队的科学家们介绍了一种用于布局规划的深度强化学习技术,借助AI的力量对计算机芯片内的不同元件进行放置协调。研究人员们设法使用强化学习技术设计出下一代张量处理单元,也就是谷歌引以为傲的专用AI处理器。 

在芯片设计当中使用软件并非新鲜事物,但谷歌研究人员们介绍道,这种新的强化学习模型能够“自动生成芯片布局图,其成果在各项关键指标(包括功耗、性能与芯片面积等)上都等同甚至优于由人类给出的芯片布局方案。”更重要的是,其设计周期要远远低于人类工作时长。 

事实上,AI在众多领域表现出的强于人类的智能水平已经得到各方关注。一家媒体将其描述为“能够以超越人类的速度设计出计算机芯片的AI软件”,并表示“” 

另一篇报道则认为,“AI技术在AI设计芯片领域的宏图远景才刚刚拉开帷幕。” 

但在通读这篇论文之后,真正打动我的并不是这套负责设计计算机芯片的AI系统的极度复杂性,而是人类与AI之间和谐而高效的协同作用。 

类比、直觉与奖励 

这篇论文将有待解决的问题描述为:“芯片布局规划流程,包括将网表放置在芯片画布(二维网格)之上,优化性能指标(例如功耗、时序、面积与线长),同时遵循严格的密度限制与路由拥塞约束。” 

基本上,这项任务的核心就是以最佳方式放置芯片元件。然而,与其他经典问题一样,随着芯片元件数量的持续增加,寻找最佳设计会变得愈发困难。 

现有软件有助于加快芯片排布的发现速度,但如果目标芯片的复杂度过高,传统软件方案明显无法满足需求。研究人员决定从强化学习解决其他复杂空间问题的众多案例中汲取经验,并发现围棋AI在这方面似乎颇具潜力。 

从谷歌AI设计芯片上,我们看到了“智能”的本质

研究人员们在论文中写道,“芯片布局规划与围棋非常相似,也有一个个棋子(例如网表拓扑、宏计数、宏尺寸与纵横比)、棋盘(不同的画布尺寸与纵横比)以及获胜条件(例如密度及路由拥塞限制等不同评估指标的相对重要度)。” 

芯片设计需要用到人类智能中最重要、也最为复杂的元素之一——类比。我们人类可以从以往解决的问题中提取抽象经验,并将这些经验应用于新的问题。虽然我们这种能力的使用可以说是潜移默化、顺畅自然,但其本身极为重要、甚至可以说是迁移学习的实现前提。正因为如此,研究人员才能将芯片布局问题重新定义为棋类游戏,并像其他科学家解决围棋游戏那样攻克设计难题。 

深度强化学习模型特别擅长搜索这种巨大空间,而人类大脑的算力水平在物理上根本实现不了这样的处理。不过科学家们面临的芯片设计难题,在困难度上又比围棋高了几个数量级。研究人员们写道,“在包含1000个单元格的网格上放置1000个节点集群时,其状态空间达到千次方数量级(大于10的2500次方),而围棋的状态空间仅为10的360次方。”而实际需要设计的芯片,则往往由数百万个节点组成。

最终,他们使用人工神经网络解决了复杂性难题。人工神经网络能够将芯片设计编码为向量表达,并大大降低问题空间的探索难度。根据论文的解释,“我们有着这样一种直觉,即能够执行常规芯片放置任务的策略,还应该能够在推理过程中将未见过的全新芯片相关状态编码为有意义的信号。因此,我们训练出一种能够预测新网表位置奖励的神经网络架构,而最终目标是使用这套架构作为策略中的编码器层。” 

很多朋友都觉得“直觉”这东西不太靠谱,但直觉的背后却涉及一种非常复杂且鲜为人知的过程,涉及经验、无意识知识、模式识别等等。我们的直觉往往来自在某个领域的多年经验积累,但同时也会从其他专业中得到启发。幸运的是,在高性能计算与机器学习工具的帮助之下,对直觉判断进行测试正变得越来越简单。 

另外值得注意的是,强化学习系统需要精心设计的奖励机制。事实上,有科学家认为只要设定正确的奖励函数,强化学习甚至足以达成人工通用智能(AGI)。而如果没有正确的奖励,强化学习代理则可能陷入无限循环,重复愚蠢而无意义的尝试。在以下视频中,可以看到参加赛船冠军赛的强化学习代理一味追求高积分,反而放弃了真正重要的目标——赢下比赛。 




上一篇:这场大比拼,“火药味”十足!来看建德10位镇村
下一篇:没有了