基于静态随机存取存储器的存内计算研究综述:电路,功能以及应用
近年来,硅基光电子技术由于其在高密度、高性能光电集成电路方面的巨大潜力而受到广泛的关注。它与CMOS技术的兼容性更进一步使其具备成为大规模、廉价光电子集成电路平台的潜力。但对于硅材料来说,其~1.12 eV的禁带宽度使其几乎不吸收1310 nm和1550 nm通信波段的光,因而硅本身很难用于通信波段的光电探测器。光电转换是光互连中不可或缺的关键部分,高速和高灵敏度的探测器可以左右整个光互连系统的设计、性能和成本。因此,实现高性能的光电探测器是近年来,随着大数据和人工智能(artificial intelligence, AI)等关键技术的突破,以边缘计算和智能生活为代表的新兴智能应用出现在快速发展的时代潮流中。这些新兴的智能应用在处理事件时往往需要频繁访问内存。然而,冯·诺依曼体系架构是最常用的数据处理体系架构,它是通过分离内存和计算单元来实现的。大量数据在内存和计算单元之间往返,这会消耗大量能源。此外,内存带宽限制了计算吞吐量。由此产生的内存限制会增加能耗和延迟,并降低效率。这种限制在资源受限的设备中更为严重。因此,探索解决“存储墙”问题的方法非常重要。
作为一种旨在解决冯·诺依曼瓶颈的计算架构,有学者提出了内存计算(computing in-memory, CIM)技术。所谓内存计算是一种直接在内存中进行计算的新体系架构和技术。它突破了传统体系架构的局限性,优化了存储单元和逻辑单元的结构,实现了存储单元和逻辑单元的集成,避免了将数据传输到处理器寄存器进行计算再返回内存的繁琐过程,从而显著降低了芯片的延迟和能耗。静态随机存取存储器(SRAM)因其单元的健壮性和存取速度而成为存算中一个热门的研究课题。
近日,安徽大学吴秀龙教授和蔺智挺教授课题组在基于SRAM存内研究领域中取得了一些进展,并且将该领域研究成果做了总结与展望。他们在该工作中从电路、功能和应用三个层面系统地回顾了基于SRAM的存内计算技术的研究进展。并且还指出了目前基于SRAM存内计算面临的问题、挑战以及其应用前景。第一个层面电路主要包括两方面:1)基本存储单元,包括读写分离结构、可转置结构和紧凑耦合结构;2)外围辅助电路,包括模数转换电路(analog-to-digitalconversion, ADC)、数模转换电路(digital-to-analogconversion, DAC)、冗余参考列,数字辅助电路和模拟辅助电路(图1(a))。第二个层面所能实现的运算操作:1)纯数字存内计算,包括布尔逻辑和内容可寻址(content-addressablememory, CAM); 2)混合信号存内计算,包括乘累加(multiplication andaccumulation, MAC)、汉明距离和绝对值差和(sum of absolute difference, SAD)(图1(b))。第三个层次主要从加速卷积神经网络算法(Convolutional Neural Network, CNN)、分类器算法、模式识别算法(k-nearest neighbor, k-NN)和高级加密标准算法(Advanced Encryption Standard, AES)等应用方面进行总结与回顾(图1(c))。最后,从这三个层面讨论了基于SRAM的存内计算面临的挑战和未来的发展前景。
基于SRAM存内计算目前已取得了一定的研究进展,该技术大大提高了系统的运算速度。这也为未来将存算技术实际商用提供了坚实基础。
图1. 基于SRAM存算一体化研究总体框架:(a)采用的电路;(b)运算功能;(c)应用场景。
A review on SRAM-based computing in-memory: Circuits, functions, and applications
Zhiting Lin, Zhongzhen Tong, Jin Zhang, Fangming Wang, Tian Xu, Yue Zhao, Xiulong Wu, Chunyu Peng, Wenjuan Lu, Qiang Zhao, Junning Chen
J. Semicond. 2022, 43(3): 031401
doi: 10.1088/1674-4926/43/3/031401
Full Text: http://www.jos.ac.cn/article/doi/10.1088/1674-4926/43/3/031401%20?pageType=en
来源:半导体学报2022年第3期中文导读