本帖最后由 eefishing 于 2019-4-12 09:59 编辑
前沿 最近针对恩智浦的网红MCU(i.MX RT1050/60)的消息和报道真是捷报不断,就在今年2月底的年度嵌入式大会上(Embedded World),恩智浦和亚马逊共同宣布了全球第一款基于MCU方案的Alexa AVS智能语音服务解决方案,也就意味着目前恩智浦基于i.MX RT106A系列的MCU智能语音方案,正式通过了亚马逊的各项技术指标的测试和认证。 这是一个里程碑式的跨越,意味着之前面临的许多技术细节和难题终于得以解决,一分耕耘一分收获,借着这个热点我们再来同步一下最新的技术方案,和如何让方案成为最终产品真正推向市场。 时间过得真快,继上次那篇侧重技术探讨的文章《基于i.MX RT MCU的语音识别方案》发布至今已经三个多月过去了,主要的技术讨论在上一篇文章里已经有很详细的阐述,而这一次是真正修成正果,能够以官方发布的方式,提供详尽的基于创新型的MCU AVS方案的软硬件工程文档,真的很期待全球第一个基于MCU Alexa的AVS产品能够尽快投入市场。 关于i.MX RT106A的Alexa语音方案开发板,可以访问Amazon的官方网站查询(点击此处)
方案概览 i.MX RT106A是i.MX RT1060跨界处理器系列产品中,专门针对云端嵌入式智能语音处理的完整解决方案。 这是基于NXP对ARM Cortex-M7内核的高级集成和实现,主频达到了600MHz,并带有大容量指令和数据缓存处理的高性价比MCU处理器。 基于i.MX RT106A的语音方案,能帮助终端客户和开发者快速开发和发布针对智能家电、智能家居、智能零售和智能工业的低成本、低功耗语音设备。i.MX RT106A语音方案,将通过完全授权的软件包许可协议提供给客户以下功能和特性: -远场语音前端软件DSP -回声消除算法 -环境噪声抑制算法 -波束成型算法 -语音断续修正算法 -音频回放处理(本地及云端) -编解码支持 -语音特定词唤醒AI预测引擎 -语音媒体流处理 -MQTT,LwIP,TLS (IoT协议,轻量级IP协议,加密算法) -基于APP的Wi-Fi设备扫描及发现注册 -所有的驱动层源代码开放,包括Wi-Fi和蓝牙 -提供恩智浦免费的MCUXpresso SDK及IDE工具 下表列出了部分正式的Part number可供后续BOM的设计和报价:
硬件框架 之前已经针对硬件框架结构做了详细说明,和最终发布的硬件原理图相比,总体上保持不变,最新的硬件版本确定使用i.MX RT106A作为主SoC(包含内部的AFE,WWE软件授权)。 芯片内嵌的SRAM空间达到1MB,可以使能更多的软件算法和保留后续的功能扩展,并且最终硬件设计上使用了3个数字麦克风,理论上软件可以支持配置成一个或者两个数字麦克风,但考虑到软件DSP的算法及参数调教等工作,建议保持当前的硬件配置以减少工作量和保持最好的声学指标性能。 针对软件的复杂性和第三方器件替换带来的巨大工作量,我们建议采用参考设计使用到的Wi-Fi/蓝牙模块,尤其是在项目初期需要快速拿出样机的阶段。当然客户可以根据产品的量产规模和自身的技术优势,以及能力等综合因素来考虑是否替换某些更有成本优势的器件,但我们并不提倡这样做。 下图就是最新的硬件框架可以作为参考,事实上这是模块化设计的框图,真正的产品设计可以布局成更紧凑的PCB板,省略各种接口部件以进一步降低成本。 i.MX RT106A Alexa AVS方案的硬件框架图
软件框架 和上一期的软件框架图相比,总体上也是保持架构不变。主要变化是针对AWS IoT软件SDK的要求,有针对性地集成了需要用到的应用和服务,增加了Alexa的特定软件部件。 另外对于Machine Learning的预测引擎,目前只包含有“Alexa”的唤醒词支持,不包含本地控制命令词定制的AI模型,从而降低软件的成本和内存的开销。 我们将在后续针对其他应用场景的开发,加入本地语音控制命令的模型支持。 i.MX RT106A Alexa语音服务方案的软件架构
整体方案的片上资源的利用率如下: -RAM ~700 kB ( 500 kB TCM ) -Flash <4 MB -CPU 大约为 80% (未作优化) 为了给大家一个直观的印象,我们特定录取了一段在有背景音乐干扰的情况下进行AlexaAVS语音服务的演示视频,请参看下面的视频:
为何选择基于MCU的AVS? 基于MCU的方案实现能够使模块具有更小的尺寸和更低的成本。 -毫无疑问,基于MCU的方案相比于MPU的方案,能够得到更小的设计尺寸和更低的成本。 -MCU运行在RTOS上只需要很小的Flash和RAM,恩智浦的MCU AVS方案不需要外部的RAM,仅仅需要一块小尺寸的外部Flash。 -更小的尺寸和更少的外部器件的需求,也就决定了基于MCU的方案相比MPU的语音方案,能够获得在系统功耗方面压倒性的优势。 -基于纯软件方案的DSP作为语音的前端处理,不需要外部的第三方DSP处理芯片,大大降低了成本。由于处理能力的不足,很多MCU必须借助外部专用硬件DSP来实现语音的前端处理。 -基于MCU的系统设计不需要专门的外部PMIC,而仅仅需要几路基本的电源Regulator,这又大大降低了成本和功耗。
为何选择恩智浦的MCU AVS方案? 恩智浦是全球第一家,提供通过了亚马逊Alexa测试认证的AVS语音服务方案。基于恩智浦的交钥匙方案,能够帮助客户以最快的速度和最小的研发投入,使定制化的产品投入市场。 -产品化的交付等级,成本的最优化和硬件工程资料完全开放(原理图,BOM参考,layout)。 -产品化的方案集成和能够量产的软件交付,完全由亚马逊测试认证的品质保证。 -Out-Of-Box的Alexa语音服务方案。 -借助恩智浦基于全球广泛而可靠的代理及分发行销网络的支持。 -整个系统还盈余超过100MHz CPU带宽及超过300KB的RAM资源作为客户项目的整合和定制化。 另外更重要的一点,恩智浦在中国拥有IoT解决方案开发和支持的工程师团队,可以贴身为客户提供服务。
如何申请软硬件开发资源? 总体解决方案的概述。 找到你要的文档 如果需要进一步的资料您需要通过NDA来获取: 原理图,BOM,Gerbers 开发人员手册 软件版本发布文档 完整的软件源代码开发包(除了AFE和WWE作为库发布) OOBE视频 开发者教程等视频
怎么样,你心动了吗?
阅读原文>>
浏览更多精彩内容,请搜索并关注“恩智浦MCU加油站”微信公众号
|