恩智浦正式发布基于MCU的Alexa语音服务解决方案.

eefishing · 发表于 2019-4-12 09:59:06

本帖最后由 eefishing 于 2019-4-12 09:59 编辑

前沿

最近针对恩智浦的网红MCU（i.MX RT1050/60）的消息和报道真是捷报不断，就在今年2月底的年度嵌入式大会上（Embedded World），恩智浦和亚马逊共同宣布了全球第一款基于MCU方案的Alexa AVS智能语音服务解决方案，也就意味着目前恩智浦基于i.MX RT106A系列的MCU智能语音方案，正式通过了亚马逊的各项技术指标的测试和认证。

这是一个里程碑式的跨越，意味着之前面临的许多技术细节和难题终于得以解决，一分耕耘一分收获，借着这个热点我们再来同步一下最新的技术方案，和如何让方案成为最终产品真正推向市场。

时间过得真快，继上次那篇侧重技术探讨的文章《基于i.MX RT MCU的语音识别方案》发布至今已经三个多月过去了，主要的技术讨论在上一篇文章里已经有很详细的阐述，而这一次是真正修成正果，能够以官方发布的方式，提供详尽的基于创新型的MCU AVS方案的软硬件工程文档，真的很期待全球第一个基于MCU Alexa的AVS产品能够尽快投入市场。

关于i.MX RT106A的Alexa语音方案开发板，可以访问Amazon的官方网站查询(点击此处)

方案概览

i.MX RT106A是i.MX RT1060跨界处理器系列产品中，专门针对云端嵌入式智能语音处理的完整解决方案。

这是基于NXP对ARM Cortex-M7内核的高级集成和实现，主频达到了600MHz，并带有大容量指令和数据缓存处理的高性价比MCU处理器。

基于i.MX RT106A的语音方案，能帮助终端客户和开发者快速开发和发布针对智能家电、智能家居、智能零售和智能工业的低成本、低功耗语音设备。i.MX RT106A语音方案，将通过完全授权的软件包许可协议提供给客户以下功能和特性：

-远场语音前端软件DSP

-回声消除算法

-环境噪声抑制算法

-波束成型算法

-语音断续修正算法

-音频回放处理（本地及云端）

-编解码支持

-语音特定词唤醒AI预测引擎

-语音媒体流处理

-MQTT，LwIP，TLS （IoT协议，轻量级IP协议，加密算法）

-基于APP的Wi-Fi设备扫描及发现注册

-所有的驱动层源代码开放，包括Wi-Fi和蓝牙

-提供恩智浦免费的MCUXpresso SDK及IDE工具

下表列出了部分正式的Part number可供后续BOM的设计和报价：

硬件框架

之前已经针对硬件框架结构做了详细说明，和最终发布的硬件原理图相比，总体上保持不变，最新的硬件版本确定使用i.MX RT106A作为主SoC（包含内部的AFE，WWE软件授权）。

芯片内嵌的SRAM空间达到1MB，可以使能更多的软件算法和保留后续的功能扩展，并且最终硬件设计上使用了3个数字麦克风，理论上软件可以支持配置成一个或者两个数字麦克风，但考虑到软件DSP的算法及参数调教等工作，建议保持当前的硬件配置以减少工作量和保持最好的声学指标性能。

针对软件的复杂性和第三方器件替换带来的巨大工作量，我们建议采用参考设计使用到的Wi-Fi/蓝牙模块，尤其是在项目初期需要快速拿出样机的阶段。当然客户可以根据产品的量产规模和自身的技术优势，以及能力等综合因素来考虑是否替换某些更有成本优势的器件，但我们并不提倡这样做。

下图就是最新的硬件框架可以作为参考，事实上这是模块化设计的框图，真正的产品设计可以布局成更紧凑的PCB板，省略各种接口部件以进一步降低成本。

i.MX RT106A Alexa AVS方案的硬件框架图

软件框架

和上一期的软件框架图相比，总体上也是保持架构不变。主要变化是针对AWS IoT软件SDK的要求，有针对性地集成了需要用到的应用和服务，增加了Alexa的特定软件部件。

另外对于Machine Learning的预测引擎，目前只包含有“Alexa”的唤醒词支持，不包含本地控制命令词定制的AI模型，从而降低软件的成本和内存的开销。

我们将在后续针对其他应用场景的开发，加入本地语音控制命令的模型支持。

i.MX RT106A Alexa语音服务方案的软件架构

整体方案的片上资源的利用率如下：

-RAM ~700 kB ( 500 kB TCM )

-Flash <4 MB

-CPU 大约为 80% (未作优化)

为了给大家一个直观的印象，我们特定录取了一段在有背景音乐干扰的情况下进行AlexaAVS语音服务的演示视频，请参看下面的视频：

为何选择基于MCU的AVS？

基于MCU的方案实现能够使模块具有更小的尺寸和更低的成本。

-毫无疑问，基于MCU的方案相比于MPU的方案，能够得到更小的设计尺寸和更低的成本。

-MCU运行在RTOS上只需要很小的Flash和RAM，恩智浦的MCU AVS方案不需要外部的RAM，仅仅需要一块小尺寸的外部Flash。

-更小的尺寸和更少的外部器件的需求，也就决定了基于MCU的方案相比MPU的语音方案，能够获得在系统功耗方面压倒性的优势。

-基于纯软件方案的DSP作为语音的前端处理，不需要外部的第三方DSP处理芯片，大大降低了成本。由于处理能力的不足，很多MCU必须借助外部专用硬件DSP来实现语音的前端处理。

-基于MCU的系统设计不需要专门的外部PMIC，而仅仅需要几路基本的电源Regulator，这又大大降低了成本和功耗。

为何选择恩智浦的MCU AVS方案？

恩智浦是全球第一家，提供通过了亚马逊Alexa测试认证的AVS语音服务方案。基于恩智浦的交钥匙方案，能够帮助客户以最快的速度和最小的研发投入，使定制化的产品投入市场。

-产品化的交付等级，成本的最优化和硬件工程资料完全开放（原理图，BOM参考，layout）。

-产品化的方案集成和能够量产的软件交付，完全由亚马逊测试认证的品质保证。

-Out-Of-Box的Alexa语音服务方案。

-借助恩智浦基于全球广泛而可靠的代理及分发行销网络的支持。

-整个系统还盈余超过100MHz CPU带宽及超过300KB的RAM资源作为客户项目的整合和定制化。

另外更重要的一点，恩智浦在中国拥有IoT解决方案开发和支持的工程师团队，可以贴身为客户提供服务。

如何申请软硬件开发资源？

请访问 www.nxp.com/mcu-avs

总体解决方案的概述。

找到你要的文档

如果需要进一步的资料您需要通过NDA来获取：

原理图，BOM，Gerbers

开发人员手册

软件版本发布文档

完整的软件源代码开发包（除了AFE和WWE作为库发布）

OOBE视频

开发者教程等视频

怎么样，你心动了吗？

阅读原文>>
浏览更多精彩内容，请搜索并关注“恩智浦MCU加油站”微信公众号

阅读全文

恩智浦正式发布基于MCU的Alexa语音服务解决方案.

站长推荐 /3