东芝存储器株式会社成功开发出用于深度学习处理器的高速、高能效算法和硬件架构

时间:2018-11-08 13:27来源:21Dianyuan

摘要:用于深度学习处理的高速、高能效算法和硬件架构,可减小识别准确度的下降幅度。该款用于在FPGA[1]上实现深度学习的新处理器的能源效率是传统产品的4倍……

存储器解决方案全球领导者东芝存储器株式会社(Toshiba Memory Corporation)今日宣布成功开发出用于深度学习处理的高速、高能效算法和硬件架构,可减小识别准确度的下降幅度。该款用于在FPGA[1]上实现深度学习的新处理器的能源效率是传统产品的4倍。这一技术成果于11月6日在台湾举行的2018年IEEE亚洲固态电路会议(A-SSCC 2018)上公诸于众。

深度学习计算通常需要大量的乘积累加(MAC)操作,因此带来了计算时间长、能耗高等问题。尽管已经提出了一系列可减少表示参数(位精度)的位数的技术来减少总计算量,而且其中的一种算法可将位精度降至一两位,但是这些技术同时又带来了识别准确度下降的问题。东芝存储器株式会社所开发的新算法可优化每层神经网络中各个筛选器[2]MAC操作的位精度,减少MAC操作。使用新算法可以减少MAC操作,减小识别准确度的下降幅度。

此外,东芝存储器株式会社成功开发出一种名为位并行方法的新硬件架构,适合于不同位精度的MAC操作。该方法将各种不同的位精度逐一划分为一位并且可在无数MAC单元中并行执行1位操作。与串行执行操作的传统MAC架构相比,该方法可显著提高MAC单元的利用效率。

东芝存储器株式会社利用各种不同的位精度和位并行MAC架构在FPGA上实现了一种深度神经网络——ResNet50[3]。以ImageNet[4]图像数据集的图像识别为例,得益于上述技术的支持,识别图像数据的运算时间和能耗均降低至25%,与传统方法相比,其识别准确度的下降幅度减小。

预计将在各种设备中实现人工智能(AI)。所开发的用于深度学习处理器的高速、低能耗技术有望应用于各种边缘设备,例如智能手机和HMD[5]以及需要低能耗的数据中心。GPU等高性能处理器是人工智能实现高速运算所需要的重要设备。内存和存储器也是人工智能最重要的设备之一,它们将不可避免地需要使用大数据。东芝存储器株式会社将继续专注于人工智能技术的研发,同时推动内存和存储器方面的创新,以引领面向数据的计算。

[1] FPGA:现场可编程门阵列,一种集成电路,适用于由客户或设计人员在生产之后进行配置。
[2] 筛选器:通常,在每层神经网络中有大量筛选器(多达数千个)。
[3] ResNet50:一种深度神经网络,通常用作图像识别深度学习的基准。
[4] ImageNet:一种大型图像数据库,通常用作图像识别基准,图像数据的数量超过14,000,000。
[5] HMD:头戴式显示器

关于东芝存储器株式会社
作为存储器解决方案全球领导者,东芝存储器株式会社致力于闪存和SSD的开发、生产和销售。2018年6月,东芝存储器株式会社被一家由Bain Capital领衔的行业财团收购。东芝存储器株式会社开创性地开发出了一系列尖端的存储器解决方案和服务,丰富了人们的生活,并扩大了社会的视野。该公司创新的3D闪存技术BiCS FLASH™将对先进智能手机、PC、SSD、汽车和数据中心等高密度应用领域存储器的未来产生深远影响。

有关东芝存储器株式会社的更多详情,请访问:https://business.toshiba-memory.com/en-apac/top.html
原文版本可在businesswire.com上查阅:https://www.businesswire.com/news/home/20181106005345/en/
 

我要投稿
近期活动

Copyright 2008-2018 21dianyuan.com All Rights Reserved 备案许可证号为:津ICP备10002348