请选择 进入手机版 | 继续访问电脑版
查看: 1369|回复: 0

恩智浦正式发布基于MCU的Alexa语音服务解决方案.

[复制链接]

该用户从未签到

72

主题

80

帖子

0

版主

Rank: 7Rank: 7Rank: 7

积分
724
最后登录
2020-1-3
发表于 2019-4-12 09:59:06 | 显示全部楼层 |阅读模式
本帖最后由 eefishing 于 2019-4-12 09:59 编辑

前沿
最近针对恩智浦的网红MCU(i.MX RT1050/60)的消息和报道真是捷报不断,就在今年2月底的年度嵌入式大会上(Embedded World),恩智浦和亚马逊共同宣布了全球第一款基于MCU方案的Alexa AVS智能语音服务解决方案,也就意味着目前恩智浦基于i.MX RT106A系列的MCU智能语音方案,正式通过了亚马逊的各项技术指标的测试和认证。
这是一个里程碑式的跨越,意味着之前面临的许多技术细节和难题终于得以解决,一分耕耘一分收获,借着这个热点我们再来同步一下最新的技术方案,和如何让方案成为最终产品真正推向市场。
时间过得真快,继上次那篇侧重技术探讨的文章《基于i.MX RT MCU的语音识别方案》发布至今已经三个多月过去了,主要的技术讨论在上一篇文章里已经有很详细的阐述,而这一次是真正修成正果,能够以官方发布的方式,提供详尽的基于创新型的MCU AVS方案的软硬件工程文档,真的很期待全球第一个基于MCU Alexa的AVS产品能够尽快投入市场。
关于i.MX RT106A的Alexa语音方案开发板,可以访问Amazon的官方网站查询(点击此处)
11.png


方案概览
i.MX RT106A是i.MX RT1060跨界处理器系列产品中,专门针对云端嵌入式智能语音处理的完整解决方案。
这是基于NXP对ARM Cortex-M7内核的高级集成和实现,主频达到了600MHz,并带有大容量指令和数据缓存处理的高性价比MCU处理器。
基于i.MX RT106A的语音方案,能帮助终端客户和开发者快速开发和发布针对智能家电、智能家居、智能零售和智能工业的低成本、低功耗语音设备。i.MX RT106A语音方案,将通过完全授权的软件包许可协议提供给客户以下功能和特性:
-远场语音前端软件DSP
-回声消除算法
-环境噪声抑制算法
-波束成型算法
-语音断续修正算法
-音频回放处理(本地及云端)
-编解码支持
-语音特定词唤醒AI预测引擎
-语音媒体流处理
-MQTT,LwIP,TLS (IoT协议,轻量级IP协议,加密算法)
-基于APP的Wi-Fi设备扫描及发现注册
-所有的驱动层源代码开放,包括Wi-Fi和蓝牙
-提供恩智浦免费的MCUXpresso SDK及IDE工具
下表列出了部分正式的Part number可供后续BOM的设计和报价:
12.png


硬件框架
之前已经针对硬件框架结构做了详细说明,和最终发布的硬件原理图相比,总体上保持不变,最新的硬件版本确定使用i.MX RT106A作为主SoC(包含内部的AFE,WWE软件授权)。
芯片内嵌的SRAM空间达到1MB,可以使能更多的软件算法和保留后续的功能扩展,并且最终硬件设计上使用了3个数字麦克风,理论上软件可以支持配置成一个或者两个数字麦克风,但考虑到软件DSP的算法及参数调教等工作,建议保持当前的硬件配置以减少工作量和保持最好的声学指标性能。
针对软件的复杂性和第三方器件替换带来的巨大工作量,我们建议采用参考设计使用到的Wi-Fi/蓝牙模块,尤其是在项目初期需要快速拿出样机的阶段。当然客户可以根据产品的量产规模和自身的技术优势,以及能力等综合因素来考虑是否替换某些更有成本优势的器件,但我们并不提倡这样做。
下图就是最新的硬件框架可以作为参考,事实上这是模块化设计的框图,真正的产品设计可以布局成更紧凑的PCB板,省略各种接口部件以进一步降低成本。
13.png
i.MX RT106A Alexa AVS方案的硬件框架图

14.png


软件框架
和上一期的软件框架图相比,总体上也是保持架构不变。主要变化是针对AWS IoT软件SDK的要求,有针对性地集成了需要用到的应用和服务,增加了Alexa的特定软件部件。
另外对于Machine Learning的预测引擎,目前只包含有“Alexa”的唤醒词支持,不包含本地控制命令词定制的AI模型,从而降低软件的成本和内存的开销。
我们将在后续针对其他应用场景的开发,加入本地语音控制命令的模型支持。
15.png
i.MX RT106A Alexa语音服务方案的软件架构

整体方案的片上资源的利用率如下:
-RAM ~700 kB ( 500 kB TCM )
-Flash <4 MB
-CPU 大约为 80% (未作优化)
为了给大家一个直观的印象,我们特定录取了一段在有背景音乐干扰的情况下进行AlexaAVS语音服务的演示视频,请参看下面的视频:





为何选择基于MCU的AVS?
基于MCU的方案实现能够使模块具有更小的尺寸和更低的成本。
-毫无疑问,基于MCU的方案相比于MPU的方案,能够得到更小的设计尺寸和更低的成本。
-MCU运行在RTOS上只需要很小的Flash和RAM,恩智浦的MCU AVS方案不需要外部的RAM,仅仅需要一块小尺寸的外部Flash。
-更小的尺寸和更少的外部器件的需求,也就决定了基于MCU的方案相比MPU的语音方案,能够获得在系统功耗方面压倒性的优势。
-基于纯软件方案的DSP作为语音的前端处理,不需要外部的第三方DSP处理芯片,大大降低了成本。由于处理能力的不足,很多MCU必须借助外部专用硬件DSP来实现语音的前端处理。
-基于MCU的系统设计不需要专门的外部PMIC,而仅仅需要几路基本的电源Regulator,这又大大降低了成本和功耗。


为何选择恩智浦的MCU AVS方案?
恩智浦是全球第一家,提供通过了亚马逊Alexa测试认证的AVS语音服务方案。基于恩智浦的交钥匙方案,能够帮助客户以最快的速度和最小的研发投入,使定制化的产品投入市场。
-产品化的交付等级,成本的最优化和硬件工程资料完全开放(原理图,BOM参考,layout)。
-产品化的方案集成和能够量产的软件交付,完全由亚马逊测试认证的品质保证。
-Out-Of-Box的Alexa语音服务方案。
-借助恩智浦基于全球广泛而可靠的代理及分发行销网络的支持。
-整个系统还盈余超过100MHz CPU带宽及超过300KB的RAM资源作为客户项目的整合和定制化。
另外更重要的一点,恩智浦在中国拥有IoT解决方案开发和支持的工程师团队,可以贴身为客户提供服务。



如何申请软硬件开发资源?
总体解决方案的概述。
找到你要的文档
如果需要进一步的资料您需要通过NDA来获取:
原理图,BOM,Gerbers
开发人员手册
软件版本发布文档
完整的软件源代码开发包(除了AFE和WWE作为库发布)
OOBE视频
开发者教程等视频
22.png

怎么样,你心动了吗?



阅读原文>>
浏览更多精彩内容,请搜索并关注“恩智浦MCU加油站”微信公众号
回复

使用道具 举报

您需要登录后才可以回帖 注册/登录

本版积分规则

关闭

站长推荐上一条 /4 下一条

Archiver|手机版|小黑屋|恩智浦技术社区

GMT+8, 2024-4-18 22:28 , Processed in 0.112225 second(s), 20 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表