• 推荐阶段
  • 初评入围
  • 成果展现
  • 网络投票
  • 结果公布

项目名称:面向边缘智能的存算一体芯片及系统

项目简介

字体:大一号   小一号

本项目面向人工智能的通用芯片的能效困境,利用存算一体新型计算范式,在电路-架构-芯片-系统等多个层面进行了跨层次融合的技术创新,相比传统芯片架构实现了2-3个数量级的能效提升。

Due to energy efficiency dilemma of the general-purpose chips for artificial intelligence applications, using novel Computing-in-Memory paradigm, this project has carried out multiple technological innovations at circuit-architecture-chip-system levels. Compared with the chips using the conventional architecture, the proposed technologies can achieve 2-3 orders of magnitude for energy efficiency improvement.
 

8
转发

项目团队

字体:大一号   小一号

该项目由浙江大学信电学院卓成研究员负责,协同尹勋钊研究员带领团队展开存算芯片设计和设计工具的研究,同时联合北京知存科技有限公司进行芯片实现、测试和可靠性优化。项目研究团队长期关注集成电路设计和设计自动化的研究,聚焦于现代计算架构普遍存在的功耗墙和内存墙两大挑战,针对譬如类脑计算等未来计算型态和新型器件展开存算一体电路和设计工具的前瞻性研究,做出一系列优秀工作。其研究获国自然重点、面上、重点研发、省重大、省重点研发等多个项目的资助,与国内外设计企业展开技术合作应用落地的探索。团队在该领域发表包括IEEE TCAD,IEEE TED,Nature Electronics,DAC,IEDM在内的多篇器件、设计和设计自动化领域国际知名期刊/会议论文, 获得设计自动化两大顶会DAC’16和ICCAD’20最佳论文提名。项目负责人曾获ACM/SIGDA技术领袖奖,德国洪堡基金会资深学者奖等多个奖项,获邀担任IEEE TCAD、ACM TODAES等多个业内权威期刊编委和多个国际会议组织委员会主席/成员。

8
转发

资料图片

字体:大一号   小一号

研究团队

 

传统芯片与存算一体芯片(a)架构示意图与(b)能效对比

 

存算一体高密度高并发性基本电路单元。图2.基于存算(a)布尔逻辑电路;(b)动态逻辑电路;(c)全加器;(d)乘法器。

 

精度可配置可配置近似乘法器

 

精度可配置可配置近似乘法器的能效提升测试结果

 

(a) 基于存算芯片的边缘智能系统软硬件协同优化方法;(b)面向边缘智能的40nm工艺芯片、开发板和测试系统

8
转发

科学解读

字体:大一号   小一号

如今在工作生活各个领域中早已司空见惯的计算机,或许大家已经忘了最初科学家是想通过机器模拟出一个人类大脑。

经过60余年的发展后,如今的芯片厂家已经可以宣称在厘米见方的芯片上能够完成每秒数千亿次操作,远超人类所能达到的效率,而人工智能、元宇宙等新兴领域,也时不时进入大众的视野,在潜移默化地改变人们生活方式的同时,也给人们带来未来信息社会的无穷遐想。

然而,人们没有注意到的是,为了模拟人脑,现有技术却仍显得较为乏力,以大家熟知的Alpha Go举例,其击败李世石九段时使用了数百个GPU,所需要的能量达到了李世石的数万倍;更接近我们生活的是手机等智能设备,虽然性能和智能性逐年提升,但续航和发热控制上却始终难以取得突破,仍需一天一充甚至两充,更有甚者,使用手机时竟然被烫伤;在专业的数据中心,除了为执行计算任务的芯片提供庞大的电力以外,还需要大量空调等制冷设备来辅助散热。

那么,和人脑相比,为什么电脑需要消耗如此多的能量呢?

我们将芯片的结构比作大家熟知的校园,一条条数据和指令就好比在学校中学习和生活的同学,学校(芯片)往往大致可以划分为学习区(计算单元)和生活区(存储单元),一般情况下我们每日往返于两地,在生活区吃饭睡觉,在学习区工作学习,然而,也有少数真的猛士(或被ddl逼得走投无路之人)表示:通勤只会影响我学习的速度。他们在自习室、实验室刷夜爆肝,爆发出惊人的效率;对于芯片而言,9成以上的时间和能量浪费在了数据和指令在计算单元和存储单元往返的过程中,在制约芯片性能的同时,还产生了巨大的发热量,这就是所谓“内存墙”瓶颈。如果能将二者合二为一,是否能将现有芯片的性能和能效再提升一个台阶呢?答案是肯定的,而且,这一思路也与计算机最初模仿的目标——人脑的原理相吻合,我们有理由相信,存储-计算相融合的技术,会使我们的计算机朝着具有强大的处理能力和极低功耗的人脑的方向更进一步。

本项目便是在芯片向更高效更节能的人脑进化过程中的前沿研究,从底层器件到上层系统等多个层次,以期解决存算一体芯片的若干关键问题。在器件层面,现有的集成电路基本元件——CMOS开关并不适用于构建存算一体电路,这就好比在实验室趴桌子睡一天两天可以接受,睡久了必然不太舒服。因此,我们使用新型非易失性存储器件,其本身即具备存储和计算的能力,是用于设计和制造存算芯片的绝佳选择。本课题组经过多年来的研究和探索,设计、优化实现了各种计算功能的存算电路,包括逻辑运算、算术运算、矩阵运算以及特征匹配操作等,能够覆盖人工智能算法中的各种计算需求,例如,我们设计并制造的仅用两个晶体管构建单个存储单元的内容寻址内存,相比传统CMOS静态存储器存储密度提升23倍,将其应用于人工智能硬件中推理操作,相比传统基于GPU的神经网络硬件提升了60倍能效和2700倍搜索性能;我们设计的存算一体乘法器,相较于CMOS节约了73%和32%的面积和能耗,在能量匮乏要求长续航的移动或边缘场景下具有很大优势;此外,我们还在算法-硬件协同上取得进展,设计了可根据算法需求实时配置计算单元精度的近似处理电路,在不降低神经网络准确率的基础上将能效提高122倍;再者,我们还完善了存算一体芯片设计、测试工具链,为存算一体芯片的开发提供了完整的开发环境和验证通道,大幅缩短了开发流程。相关工作成果发表于IEEE TC,IEEE TCAS-I,DAC,DATE,ICCAD等多个国际知名期刊和会议。

在当前以科技竞争为主的大国博弈中,具备高算力、低功耗的新一代人工智能芯片正成为一条科技新赛道,随着各国争相部署和实施多项类脑研究计划,重大理论成果或技术革命正在孕育。本项目利用新型器件贴点晶体管和存算一体技术,在器件-电路-算法-系统多个层面探索并解决了高能效人工智能芯片的关键技术,为未来智能芯片发展提供了参考和关键技术支撑,也与浙江大学的“双脑计划”互为支撑和补充,对于提高我国智能芯片领域核心竞争力、促进新一代智能芯片在人工智能/物联网领域的应用,有着重要意义和实际应用价值。

 

8
转发

互动评论

点击通过统一身份认证登录。

字体:大一号   小一号