请选择 进入手机版 | 继续访问电脑版
查看: 2698|回复: 1

【RT1052】6、离线语音识别的移植初步完成

[复制链接]
  • TA的每日心情
    开心
    2021-4-13 21:11
  • 签到天数: 550 天

    [LV.9]以坛为家II

    14

    主题

    1049

    帖子

    5

    金牌会员

    Rank: 6Rank: 6

    积分
    2417
    最后登录
    2022-6-16
    发表于 2018-11-30 09:35:57 | 显示全部楼层 |阅读模式


        离线语音识别部分基于arm开源的项目ML-kws-for-MCU,目前只是代码跑通了,基本说的单词都能识别出来。但是问题是不说话时候也能检测到单词
        1、下图正确的识别结果:
             1.png

        2、下图是噪声被错误识别
             2.png

    接下来的问题:
        1、声音降噪滤波:首先硬件上,双mic是一定要有的,ok1052只有一个mic插孔,但是支持立体声,左右声道当作双mic来用应该是可行的。至于软件,这个技术在手机上好像很成熟了,但是不知道mcu上有没有开源的项目,如果哪位大神知道话,请指点下。
       2、语音模型:这种识别方法貌似是基于神经网络的,这块不熟悉。目前只知道如果想要某个特定的词语,需要训练语音模型,但是这要求有大量的语音数据用来训练,这个挺难,图片还好找,但语音数据不知道怎么搜集,总不能站大街碰到一个人就让人录一段(不被打就万幸了)。好在项目本身提供了一个语音库,从里面找一个已经有的词还是可行的。
       3、神经网络参数优化:这块是最头疼的,完全不懂,只能以后慢慢摸索


    代码: imxrt1052-evk.zip (1.86 MB, 下载次数: 60)
    哎...今天够累的,签到来了~
    回复

    使用道具 举报

  • TA的每日心情

    2021-2-4 09:24
  • 签到天数: 190 天

    [LV.7]常住居民III

    38

    主题

    591

    帖子

    28

    金牌会员

    Rank: 6Rank: 6

    积分
    2193
    最后登录
    2023-12-1
    发表于 2018-11-30 10:22:19 | 显示全部楼层
    楼主很厉害
    哎...今天够累的,签到来了~
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 注册/登录

    本版积分规则

    关闭

    站长推荐上一条 /4 下一条

    Archiver|手机版|小黑屋|恩智浦技术社区

    GMT+8, 2024-3-28 21:31 , Processed in 0.117982 second(s), 23 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表