算力高达40 eTOPS,边缘AI加速神器!Ara240独立神经处理单元全解析

标签:边缘AINXP
分享到:

36

如今模型越来越大并走向多模态,还出现了设备端生成式AI和智能体AI,AI工作负载不断增长,边缘系统需要的已不仅仅是渐进式的算力提升,而是专门的加速能力,以实现实时性能、更低功耗、强大的数据隐私保护以及可扩展性。Ara240独立神经处理单元 (DNPU) 正是为了满足这些边缘AI需求而构建。

 

作为恩智浦首个独立神经处理单元 (DPNU),Ara240提供了AI优化的架构,拥有高达40 eTOPS的算力、大容量片上存储器和高片外带宽。总而言之,它专为运行先进AI、大语言模型 (LLM)、视觉语言模型 (VLM)、多模态语言模型以及下一代边缘推理而打造。

 

借助Ara240 DNPU带来的更高性能和效率,将边缘AI提升至全新高度。探索Ara240 DNPU,并利用Ara生态合作体系规划您的下一个设计,点击这里>>

 

无论是设计工业自动化系统、自主机器人、智能基础设施、先进的人机接口 (HMI) 平台还是边缘服务器,Ara240 DNPU都能提供所需的性能余量,直接在边缘运行现代AI工作负载。

 

37

图1:Ara240 DPNU为先进的AI应用实现实时、设备端推理

 

Ara240 DNPU:专为边缘先进AI而设计

 

Ara240 DNPU专为高需求的设备端AI应用而设计,在这些应用中,延迟、隐私和能效至关重要。Ara240 DNPU支持广泛使用的AI模型架构——包括卷积神经网络 (CNN)、Transformer、大语言模型 (LLM)、视觉语言模型 (VLM) 和多模态模型——使开发人员能够将生成式AI和高性能AI引入嵌入式系统和边缘系统,而无需依赖云端计算。

 

该DNPU的关键技术能力包括:

  • 高达40 eTOPS的等效算力:为主机处理器分流复杂的并行AI工作负载提供高吞吐量

  • 大容量片上存储器+专用LPDDR4接口 (高达16GB):支持更大模型和更高带宽处理,同时不增加对主机内存的争用

  • PCIe G4x4和USB 3.2 G1主机接口:提供灵活、高速的集成

  • 安全启动和硬件信任根:实现安全的AI管道和受保护的部署

  • 支持Linux和Windows运行时:为边缘系统提供广泛的兼容性

  • 框架支持:包括TensorFlow、PyTorch和ONNX

 

作为可扩展的AI配套处理器,Ara240 DNPU为那些需要在本地执行复杂推理的系统带来强大的AI加速能力——从而提供更低的延迟、更低的云成本以及更强的数据隐私保护。

 

Ara240 16GB M.2模块加速原型设计

 

为帮助开发人员更快地评估Ara240 DNPU,恩智浦提供了Ara240 16GB M.2模块,该模块可无缝集成到任何带有MKey PCIe接口的主机平台而设计。

 

模块亮点包括:

  • 高达40 eTOPS的AI性能

  • 专有神经网络处理器,运行频率高达900MHz

  • 16GB LPDDR4存储器

  • M.2 2280 MKey外形尺寸

  • PCIe G4x1/x2/x4配置

  • 目前支持i.MX 8M Plus和i.MX 95应用处理器

 

该模块为评估Ara240性能、加速概念验证开发以及将高性能AI集成到现有设计提供了一条简化路径。Ara240 16GB M.2模块将于2026年6月开始供货,您可在恩智浦官网nxp.com和代理商处购买。

38

图2:Ara240 16GB M.2模块让开发人员能够更快地基于Ara240进行原型设计

 

相得益彰:Ara + i.MX

 

Ara240 M.2模块可用作我们i.MX应用处理器的AI协处理器:

 

这种适配性使得目前使用恩智浦MPU的开发人员能够轻松地将Ara240 DNPU作为配套加速器,显著扩展AI性能。

 

紧凑、可扩展的Ara240加速器模块

 

除了恩智浦Ara240 M.2模块外,我们的生态系统合作伙伴也在推出各自基于Ara240的模块。

 

39

 

这些模块使客户能够在不同的散热、机械和性能配置下轻松评估Ara240 DNPU——支持工业PC、机器人系统和紧凑型嵌入式边缘设备等应用。这些板共同为客户提供了一条从早期评估到完整系统设计流程的顺畅开发路径。

 

赋能物理世界AI的专用软件

 

恩智浦eIQ Agentic AI框架扩展了eIQ AI软件开发环境,增加了专门设计的功能,在边缘充分利用其DNPU的加速能力。该框架通过协调多个模型 (例如视觉、语言和控制模型),同时将推理和决策高效地映射到硬件加速器而非通用CPU上,从而实现智能体AI工作负载的确定性、实时执行。

 

通过结合硬件感知型模型准备、优化的编排以及安全的设备端执行,我们的eIQ Agentic AI框架使DNPU能够为自主式和生成式AI工作负载维持低延迟和可预测的性能,在减少对云端依赖的同时,简化复杂的多模态边缘AI系统的部署。

 

借助Ara240 DNPU以及不断壮大的M.2模块生态系统,开发人员可以获得:

  • 可扩展的AI性能

  • 实时推理能力

  • 通过本地处理提升隐私保护

  • 更低的运营成本和云成本

  • 支持不断演进的模型架构的灵活性

 

借助Ara240加速边缘实时、设备端AI处理。Ara240是恩智浦首款DNPU,提供高达40 eTOPS的算力,配备可扩展的内存和带宽。了解更多关于Ara240 DPNU的详情,点击这里>>

相关资讯
算力高达40 eTOPS,边缘AI加速神器!Ara240独立神经处理单元全解析

如今模型越来越大并走向多模态,还出现了设备端生成式AI和智能体AI,AI工作负载不断增长,边缘系统需要的已不仅仅是渐进式的算力提升,而是专门的加速能力,以实现实时性能、更低功耗、强大的数据隐私保护以及可扩展性。Ara240独立神经处理单元 (DNPU) 正是为了满足这些边缘AI需求而构建。

高精度+灵活性:恩智浦创新模拟前端,赋能精准流体测量

随着各行业拥抱数字化转型和边缘AI,对更智能、更精确传感的需求日益增长。热量式(热式) 流量计因其能够以极高的灵敏度测量气体和液体流速而闻名,是这一演进的核心。采用恩智浦NAFE13144通用输入模拟前端 (AFE),设计人员能够打造出精度高且结构紧凑、可配置并支持机器学习 (ML) 应用的新一代流量计。

恩智浦收购Kinara:整合高性能独立NPU技术,提供边缘AI全栈解决方案

恩智浦迈出了重要一步。我们于2025年10月27日宣布,正式完成对Kinara的收购。Kinara是业界高性能、高能效独立神经处理单元 (DNPU) 的领导企业之一。

边缘计算和边缘AI是什么?两者有什么区别?

在科技领域,我们听惯了AI人工智能,边缘计算,却很少涉及两者的交叉与融合:边缘AI,那么边缘计算与边缘AI是什么,两者有什么区别呢?

边缘AI与嵌入式存储器迸发的曙光

随着现代社会信息量的爆炸式增长,越来越多的存储器和AI计算被用来进行信息的存储和运算。然而,即便是算力强大的云端计算,也很难完全满足数据带宽和传输速度的需求,加上人们对于数据隐私保护的重视程度不断提高,在这种现状下,边缘AI计算就成为了突破口,它能够在大数据时代助力人们的生产生活。而边缘计算中非常重要的一个部分就是嵌入式存储器。本文就来介绍一下边缘AI与嵌入式存储器是如何帮助实现大数据网络中的计算。

精彩活动