全球研究人员齐聚“NeuRRAM”神经形态芯片
这些团队开发了第一个内存计算芯片,以比其他平台更低的能量和更高的精度处理一系列人工智能应用。2022年8月22日,杰克·赫兹
边缘人工智能计算的圣杯是一种同时提供高效率、高性能和多功能性的芯片。从历史上看,获得这三种架构对设计师来说是一个重大挑战,因此,许多人已经开始考虑新的计算架构。
其中一种新架构是内存计算,旨在消除数据移动瓶颈,以实现比传统数字处理单元更高的效率和更好的性能。本周,一组国际研究人员发表了一篇论文,描述了一种基于电阻随机存取存储器(RRAM)的新型内存计算芯片。
NeuRRAM神经形态芯片。图片由加州大学可持续发展学院提供
在本文中,我们将讨论用于内存计算(CIM)的RRAM,这些解决方案的历史缺点,以及该小组新的“NeuRRAM”神经形态芯片。
用于内存计算的电阻式RAM
在过去的30年里,设计师们一直在研究内存计算的概念,最近又研究了基于电阻RAM的内存计算。
RRAM CIM消除了von Neumann瓶颈,这是内存和计算分离的结果,而是将它们合并在一起。在该架构中,电阻RAM元件用于存储器存储,其中基于每个单元中RRAM材料的电阻状态来存储二进制数字。这里,施加电压可以使RRAM成为高电阻材料,代表数字1,反之亦然。读出存储器中的位是通过向RRAM单元施加电压并读出产生的电流来实现的,该电流将根据RRAM的状态而变化。
使用RRAM CIM单元进行乘法运算的示例。图片由SemiWiki提供
RRAM是一种非常节能、小型和非易失性的存储器。这种架构也非常适合人工智能计算,因为机器学习计算在很大程度上依赖于可以使用RRAM轻松实现的乘法和累加函数。由于感测电流能够读出RRAM结果,因此可以通过对结或一系列结中的电流求和来容易地将RRAM值相加和相乘。
RRAM CIM的不足
尽管RRAM CIM带来了好处,但这项技术的研发仍然充满了障碍。
首先,早期的大部分研究都集中在RRAM芯片上进行人工智能计算,但仍然依赖芯片外资源来执行其他基本功能,如模数转换和神经元激活。这不仅限制了系统性能,而且还扭曲了基准测试。从历史上看,结果是基于设备特性的软件仿真,这几乎总是乐观的。
除此之外,RRAM CIM设备在能效、多功能性和准确性之间存在固有的权衡。来自加州大学圣地亚哥分校、斯坦福大学、清华大学和圣母大学的一组研究人员表示,以前没有任何研究试图同时优化这三个标准。
NeuRRAM在效率、准确性和灵活性方面的突破
本周,来自加州大学圣迭戈分校、斯坦福大学、清华大学和圣母院的研究人员在《自然》杂志上发表了一份报告,描述了他们称之为NeuRRAM的RRAM CIM芯片。
据说NeuRRAM神经形态芯片采用了输出传感方法,实现了效率、准确性和灵活性的结合。与为输出读取电流的传统技术相比,NeuRRAM使用了一种神经元电路,该电路可以感应电压并在芯片上执行高效的模数转换。
CIM核心和NeuRRAM体系结构的框图。图片由Nature和Wan等人提供
该体系结构包括与RRAM位单元共存的CMOS神经元电路。NeuRRAM是一款神经形态人工智能芯片,由48个神经突触核心、256个CMOS神经元和65536个RRAM细胞组成,它们执行并行处理,并可以支持数据和模型并行。这允许将不同的模型层映射到不同的核心,以实现最大的通用性。
国际研究小组声称,该芯片可以实现比传统数字处理器低2.3倍的能量延迟积(EDP),同时还可以提供高达13倍的计算密度。据说NeuRRAM在手写数字识别方面的准确率为99%,在图像分类方面的准确度为85.7%,在语音识别方面的准确性为84.7%。
总之,这项研究表明,这种芯片与传统数字芯片的精度相匹配,但能耗显著降低,密度更高。研究人员在设计这种芯片时考虑到了边缘计算,他们声称NeuRRAM的低功耗和高性能可能会实现一类新的设备,而这些设备目前在现有技术下是不可行的。