Glow 神经网络编译器首次应用于 MCU,面向边缘端机器学习
时间:2020-08-05 14:04来源:21 Dianyuan
摘要:未来几年内,对机器学习应用的需求预期将会大幅增加。据TIRIASResearch预测,到2025年,98%的边缘设备将使用某种形式的机器学习人工智能。根据市场预测,到2025年,预计将有180亿至250亿部设备包含机器学习功能,尽管它们可能并没有专用的机器学习加速器。消费型设备制造商和嵌入式物联网开发人员将需要优化机器学习框架,以便实现使用MCU的低功耗边缘嵌入式应用。
Ÿ 恩智浦展示了应用于MCU的Glow神经网络编译器为基于视觉和语音的机器学习应用带来的诸多优势。恩智浦也是首家针对MCU实现相较于标准版Glow 2至3倍性能的半导体供应商
荷兰埃因霍温——2020年8月5日——恩智浦半导体NXP Semiconductors N.V.(纳斯达克代码:NXPI)今日发布了eIQ机器学习(ML)软件对Glow神经网络(NN)编译器的支持功能,针对恩智浦的i.MX RT跨界MCU,带来业界首个实现以较低存储器占用提供更高性能的神经网络编译器应用。Glow编译器由Facebook开发,能够集成特定于目标的优化,恩智浦利用这种能力,使用适用于Arm Cortex-M内核和Cadence Tensilica HiFi 4 DSP的神经网络算子库,最大程度地提升i.MX RT685以及i.MX RT1050和RT1060的推理性能。此外,此功能已集成到恩智浦的eIQ机器学习软件开发环境中,在恩智浦的MCUXpresso SDK中免费提供。
使用Glow充分发挥MCU架构特性的优势
2018年5月,率先开发PyTorch的Facebook推出了开源社区项目Glow(Graph Lowering神经网络编译器),其目的是提供优化,提高一系列硬件平台上的神经网络性能。作为一种神经网络编译器,Glow基于未优化的神经网络生成高度优化的代码。这个特点有别于典型的神经网络模型处理,后者采用即时编译,因而需要更高的性能,还会增加存储器开销。像Glow这样直接运行优化代码可以显著降低处理和存储器要求。恩智浦也在Glow开源社区中扮演着积极角色,帮助推广和普及Glow的新功能。
Facebook软件工程经理Dwarak Rajagopal表示:“GitHub中提供的标准版Glow可以直接在任何设备上运行,让用户能够灵活地针对感兴趣的基础架构编译神经网络模型,包括Arm Cortex-A和Cortex-M内核以及RISC-V架构。恩智浦使用充分利用MCU计算元件的专用软件库,实现了2-3倍的性能提升,展示了从基于云的高端机器到低成本的嵌入式平台的广泛范围内,将Glow神经网络编译器用于机器学习应用的诸多优势。”
优化机器学习框架以增强竞争优势
未来几年内,对机器学习应用的需求预期将会大幅增加。据TIRIAS Research预测,到2025年,98%的边缘设备将使用某种形式的机器学习/人工智能。根据市场预测,到2025年,预计将有180亿至250亿部设备包含机器学习功能,尽管它们可能并没有专用的机器学习加速器。消费型设备制造商和嵌入式物联网开发人员将需要优化机器学习框架,以便实现使用MCU的低功耗边缘嵌入式应用。
恩智浦半导体资深副总裁兼边缘处理业务总经理Ron Martino表示:“借助eIQ机器学习软件框架,利用高度集成的i.MX应用处理器和高性能i.MX RT跨界MCU的强大功能,恩智浦正在推动机器学习功能在边缘设备上的实现。随着i.MX RT系列跨界MCU增加对Glow的支持,我们的客户能够编译深度神经网络模型,为他们的应用带来竞争优势。”
恩智浦的面向机器学习的边缘智能环境解决方案是一个全面的工具包,提供开发人员需要的构建模块,帮助他们高效地在边缘设备中实施机器学习。Glow整合到eIQ软件后,机器学习开发人员将拥有全面的高性能框架,可在包括i.MX RT跨界MCU和i.MX 8应用处理器的恩智浦边缘处理解决方案上进行扩展。客户拥有了更强大的工具,能够在i.MX RT MCU和i.MX应用处理器上开发机器学习语音应用、对象识别、人脸识别等应用。
利用恩智浦的Glow神经网络实施来提高性能
eIQ现在包含对Glow和TensorFlow Lite的推理支持,对于这些实施,恩智浦通常会执行基准测试以衡量其性能。MCU基准测试包括标准神经网络模型,例如CIFAR-10。以CIFAR-10模型为例,恩智浦采集的基准测试数据表明了如何利用i.MX RT1060器件(采用600MHz Arm Cortex-M7)、i.MX RT1170器件(采用1GHz Arm Cortex-M7)和i.MX RT685器件(采用600 MHz Cadence Tensilica HiFi 4 DSP)的性能优势。
恩智浦对Glow的支持离不开Cadence为Tensilica HiFi 4 DSP提供的神经网络库(NNLib),该DSP提供了4.8GMAC性能。同样以CIFAR-10为例,恩智浦的Glow实施使用这一DSP来加快神经网络运算,实现了25倍的性能提升。
Cadence Tensilica IP企业副总裁Sanjive Agarwala表示:“Tensilica HiFi 4 DSP最初集成在i.MX RT600跨界MCU中,目的是提高各种不同的音频和语音处理应用的速度。但是,当有越来越多机器学习推理应用瞄准了低成本、低功耗的MCU级应用时,HiFi 4 DSP凭借固有的DSP计算性能,成为加快这些神经网络模型的理想选择。随着恩智浦在eIQ机器学习软件中实施Glow,i.MX RT600 MCU的客户能够利用该DSP来满足多种机器学习应用的需求,包括关键词检索(KWS)、语音识别、降噪和异常检测。”
Arm公司机器学习营销副总裁Dennis Laudick表示:“恩智浦将Arm CMSIS-NN软件库包括在elQ中,目的是最大程度地提升性能,减少Arm Cortex-M内核上的神经网络存储器占用。以CIFAR-10神经网络模型为例,恩智浦能够利用CMSIS-NN实现1.8倍的性能提升。其他神经网络模型应该能够产生相似的结果,这清晰地展示了这款高级编译器和我们的优化神经网络算子库的优势。”
上市时间
恩智浦的集成Glow神经网络编译器的eIQ软件现已上市,通过i.MX RT600跨界MCU、i.MX RT1050和i.MX RT1060跨界MCU的MCUXpresso SDK提供。未来将会推出适用于恩智浦其他MCU的集成Glow神经网络编译器的eIQ软件。
关于i.MX RT系列跨界MCU
i.MX RT系列是业内首个跨界MCU产品组合,以经济的价格,提供高性能的Arm Cortex-M内核、实时功能和MCU可用性。该系列代表了低功耗应用处理器与高性能微控制器的融合。i.MX RT系列填补了传统MCU和i.MX应用处理器之间的空白,为MCU客户提供了显著提高性能和改进集成的方法,一如既往地简单易用。
有关更多信息,请访问www.nxp.com.cn/eiq和www.nxp.com.cn/eiq/glow
Ÿ 开源Glow编译器最初由Facebook开发,恩智浦现在将其集成到eIQ™机器学习软件开发环境中,为旗下i.MX RT系列跨界MCU提供高性能推理
Ÿ 恩智浦的Glow实施面向Arm® Cortex®-M内核和Cadence® Tensilica® HiFi 4 DSP,为i.MX RT系列跨界MCU提供特定平台的优化
Ÿ 恩智浦的Glow实施面向Arm® Cortex®-M内核和Cadence® Tensilica® HiFi 4 DSP,为i.MX RT系列跨界MCU提供特定平台的优化
荷兰埃因霍温——2020年8月5日——恩智浦半导体NXP Semiconductors N.V.(纳斯达克代码:NXPI)今日发布了eIQ机器学习(ML)软件对Glow神经网络(NN)编译器的支持功能,针对恩智浦的i.MX RT跨界MCU,带来业界首个实现以较低存储器占用提供更高性能的神经网络编译器应用。Glow编译器由Facebook开发,能够集成特定于目标的优化,恩智浦利用这种能力,使用适用于Arm Cortex-M内核和Cadence Tensilica HiFi 4 DSP的神经网络算子库,最大程度地提升i.MX RT685以及i.MX RT1050和RT1060的推理性能。此外,此功能已集成到恩智浦的eIQ机器学习软件开发环境中,在恩智浦的MCUXpresso SDK中免费提供。
使用Glow充分发挥MCU架构特性的优势
2018年5月,率先开发PyTorch的Facebook推出了开源社区项目Glow(Graph Lowering神经网络编译器),其目的是提供优化,提高一系列硬件平台上的神经网络性能。作为一种神经网络编译器,Glow基于未优化的神经网络生成高度优化的代码。这个特点有别于典型的神经网络模型处理,后者采用即时编译,因而需要更高的性能,还会增加存储器开销。像Glow这样直接运行优化代码可以显著降低处理和存储器要求。恩智浦也在Glow开源社区中扮演着积极角色,帮助推广和普及Glow的新功能。
Facebook软件工程经理Dwarak Rajagopal表示:“GitHub中提供的标准版Glow可以直接在任何设备上运行,让用户能够灵活地针对感兴趣的基础架构编译神经网络模型,包括Arm Cortex-A和Cortex-M内核以及RISC-V架构。恩智浦使用充分利用MCU计算元件的专用软件库,实现了2-3倍的性能提升,展示了从基于云的高端机器到低成本的嵌入式平台的广泛范围内,将Glow神经网络编译器用于机器学习应用的诸多优势。”
优化机器学习框架以增强竞争优势
未来几年内,对机器学习应用的需求预期将会大幅增加。据TIRIAS Research预测,到2025年,98%的边缘设备将使用某种形式的机器学习/人工智能。根据市场预测,到2025年,预计将有180亿至250亿部设备包含机器学习功能,尽管它们可能并没有专用的机器学习加速器。消费型设备制造商和嵌入式物联网开发人员将需要优化机器学习框架,以便实现使用MCU的低功耗边缘嵌入式应用。
恩智浦半导体资深副总裁兼边缘处理业务总经理Ron Martino表示:“借助eIQ机器学习软件框架,利用高度集成的i.MX应用处理器和高性能i.MX RT跨界MCU的强大功能,恩智浦正在推动机器学习功能在边缘设备上的实现。随着i.MX RT系列跨界MCU增加对Glow的支持,我们的客户能够编译深度神经网络模型,为他们的应用带来竞争优势。”
恩智浦的面向机器学习的边缘智能环境解决方案是一个全面的工具包,提供开发人员需要的构建模块,帮助他们高效地在边缘设备中实施机器学习。Glow整合到eIQ软件后,机器学习开发人员将拥有全面的高性能框架,可在包括i.MX RT跨界MCU和i.MX 8应用处理器的恩智浦边缘处理解决方案上进行扩展。客户拥有了更强大的工具,能够在i.MX RT MCU和i.MX应用处理器上开发机器学习语音应用、对象识别、人脸识别等应用。
利用恩智浦的Glow神经网络实施来提高性能
eIQ现在包含对Glow和TensorFlow Lite的推理支持,对于这些实施,恩智浦通常会执行基准测试以衡量其性能。MCU基准测试包括标准神经网络模型,例如CIFAR-10。以CIFAR-10模型为例,恩智浦采集的基准测试数据表明了如何利用i.MX RT1060器件(采用600MHz Arm Cortex-M7)、i.MX RT1170器件(采用1GHz Arm Cortex-M7)和i.MX RT685器件(采用600 MHz Cadence Tensilica HiFi 4 DSP)的性能优势。
恩智浦对Glow的支持离不开Cadence为Tensilica HiFi 4 DSP提供的神经网络库(NNLib),该DSP提供了4.8GMAC性能。同样以CIFAR-10为例,恩智浦的Glow实施使用这一DSP来加快神经网络运算,实现了25倍的性能提升。
Cadence Tensilica IP企业副总裁Sanjive Agarwala表示:“Tensilica HiFi 4 DSP最初集成在i.MX RT600跨界MCU中,目的是提高各种不同的音频和语音处理应用的速度。但是,当有越来越多机器学习推理应用瞄准了低成本、低功耗的MCU级应用时,HiFi 4 DSP凭借固有的DSP计算性能,成为加快这些神经网络模型的理想选择。随着恩智浦在eIQ机器学习软件中实施Glow,i.MX RT600 MCU的客户能够利用该DSP来满足多种机器学习应用的需求,包括关键词检索(KWS)、语音识别、降噪和异常检测。”
Arm公司机器学习营销副总裁Dennis Laudick表示:“恩智浦将Arm CMSIS-NN软件库包括在elQ中,目的是最大程度地提升性能,减少Arm Cortex-M内核上的神经网络存储器占用。以CIFAR-10神经网络模型为例,恩智浦能够利用CMSIS-NN实现1.8倍的性能提升。其他神经网络模型应该能够产生相似的结果,这清晰地展示了这款高级编译器和我们的优化神经网络算子库的优势。”
上市时间
恩智浦的集成Glow神经网络编译器的eIQ软件现已上市,通过i.MX RT600跨界MCU、i.MX RT1050和i.MX RT1060跨界MCU的MCUXpresso SDK提供。未来将会推出适用于恩智浦其他MCU的集成Glow神经网络编译器的eIQ软件。
i.MX RT系列是业内首个跨界MCU产品组合,以经济的价格,提供高性能的Arm Cortex-M内核、实时功能和MCU可用性。该系列代表了低功耗应用处理器与高性能微控制器的融合。i.MX RT系列填补了传统MCU和i.MX应用处理器之间的空白,为MCU客户提供了显著提高性能和改进集成的方法,一如既往地简单易用。
有关更多信息,请访问www.nxp.com.cn/eiq和www.nxp.com.cn/eiq/glow
免责声明:本文若是转载新闻稿,转载此文目的是在于传递更多的信息,版权归原作者所有。文章所用文字、图片、视频等素材如涉及作品版权问题,请联系本网编辑予以删除。
我要投稿
近期活动
- 安森美汽车&能源基础设施白皮书下载活动时间:2024年04月01日 - 2024年10月31日[立即参与]
- 2023年安森美(onsemi)在线答题活动时间:2023年09月01日 - 2023年09月30日[查看回顾]
- 2023年安森美(onsemi)在线答题活动时间:2023年08月01日 - 2023年08月31日[查看回顾]
- 【在线答题活动】PI 智能家居热门产品,带您领略科技智慧家庭时间:2023年06月15日 - 2023年07月15日[查看回顾]
- 2023年安森美(onsemi)在线答题活动时间:2023年06月01日 - 2023年06月30日[查看回顾]
分类排行榜
- 汽车电子电源行业可靠性要求,你了解多少?
- 内置可编程模拟功能的新型 Renesas Synergy™ 低功耗 S1JA 微控制器
- Vishay 推出高集成度且符合 IrDA® 标准的红外收发器模块
- ROHM 发布全新车载升降压电源芯片组
- 艾迈斯半导体推出行业超薄的接近/颜色传感器模块,助力实现无边框智能手机设计
- 艾迈斯半导体与 Qualcomm Technologies 集中工程优势开发适用于手机 3D 应用的主动式立体视觉解决方案
- 维谛技术(Vertiv)同时亮相南北两大高端峰会,精彩亮点不容错过
- 缤特力推出全新商务系列耳机 助力解决开放式办公的噪音难题
- CISSOID 和泰科天润(GPT)达成战略合作协议,携手推动碳化硅功率器件的广泛应用
- 瑞萨电子推出 R-Car E3 SoC,为汽车大显示屏仪表盘带来高端3D 图形处理性能
编辑推荐
小型化和稳定性如何兼得?ROHM 推出超小型高输出线性 LED 驱动器 IC,为插座型 LED 驱动 IC 装上一颗强有力的 “心脏”
众所周知,LED的驱动IC担负着在输入电压不稳定的情况下,为LED提供恒定的电流,并控制恒定(可调)亮度的作用。无论是室内照明,还是车载应用,都肩负着极为重要的使命。
- 关于反激电源效率的一个疑问
时间:2022-07-12 浏览量:10019
- 面对热拔插阐述的瞬间大电流怎么解决
时间:2022-07-11 浏览量:8791
- PFC电路对N线进行电压采样的目的是什么
时间:2022-07-08 浏览量:9421
- RCD中的C对反激稳定性有何影响
时间:2022-07-07 浏览量:7086
- 36W单反激 传导7~10M 热机5分钟后超标 不知道哪里出了问题
时间:2022-07-07 浏览量:5846
- PFC电感计算
时间:2022-07-06 浏览量:4073
- 多相同步BUCK
时间:2010-10-03 浏览量:37824
- 大家来讨论 系列之二:开机浪涌电流究竟多大?
时间:2016-01-12 浏览量:43115
- 目前世界超NB的65W适配器
时间:2016-09-28 浏览量:59986
- 精讲双管正激电源
时间:2016-11-25 浏览量:127878
- 利用ANSYS Maxwell深入探究软磁体之----电感变压器
时间:2016-09-20 浏览量:107493
- 【文原创】认真的写了一篇基于SG3525的推挽,附有详细..
时间:2015-08-27 浏览量:100173