查看: 10959|回复: 4

[LPC双核挑战赛] 基于LPC54114的简单语音识别

[复制链接]
回帖奖励 1 NXP金币 回复本帖可获得 1 NXP金币奖励! 每人限 1 次

该用户从未签到

1

主题

18

帖子

0

注册会员

Rank: 2

积分
99
最后登录
2018-7-9
发表于 2018-6-6 00:19:17 | 显示全部楼层 |阅读模式
本帖最后由 耗子董 于 2018-6-10 23:19 编辑

一、项目名称
  基于LPC54114的简单语音识别  (原来打算做智能门禁,但是并没能完成,非常遗憾
二、项目概述

创新点:
1.M4核运行DSP库函数,利用LPC54114浮点运算单元FPU,进行倒谱系数(MFCC)与动态时间曲折(Dynamic Time Warping)的计算,计算与预存的关键词的距离,通过比较,若小于阈值则认定为该关键词。
3.M0-Plus核进行DMIC的配置、中断、软件触发DMA传输以及缓冲区数据的刷新。

主要参数:
每帧FFT计算点数:512点(32ms)
两帧之间交叠:16ms
模板长度:18*16ms = 288ms
录音长度:25*16=400ms
MFCC滤波器个数:26个
MFCC因数长度:12
是否包含帧信号能量信息:否;
是否有一阶和二阶做差(delta)处理:否;

三、功能实现
1.硬件资源
LPC54114开发板:LPC54114-Lite

2.软件架构

程序框图

程序框图
四、实物图片
只用到了LPC54114开发板,故不上图片了。

五、演示视频
1.简单的数字语音识别:
Bililili(B站视频更加清晰): http://www.bilibili.com/video/av24526366
优酷视频:


六、项目文档
简单数字识别源代码:
SDK_2.3.1_LPC54114J256-VoiceRecognition-20180608.zip (15.99 MB, 下载次数: 63)
回复

使用道具 举报

  • TA的每日心情
    擦汗
    2021-7-5 15:45
  • 签到天数: 664 天

    [LV.9]以坛为家II

    42

    主题

    1594

    帖子

    19

    金牌会员

    Rank: 6Rank: 6

    积分
    5382
    最后登录
    2021-12-22
    发表于 2018-6-6 09:55:56 | 显示全部楼层
    这个确实不容易, 上次有位就做了个简单的,可参考
    https://www.nxpic.org.cn/module/ ... 3%E8%AF%86%E5%88%AB
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    1

    主题

    18

    帖子

    0

    注册会员

    Rank: 2

    积分
    99
    最后登录
    2018-7-9
     楼主| 发表于 2018-6-6 15:29:08 | 显示全部楼层
    okwh 发表于 2018-6-6 09:55
    这个确实不容易, 上次有位就做了个简单的,可参考
    https://www.nxpic.org.cn/module/forum/forum.php?mod=view ...

    嗯嗯,刚开始就是参考这个帖子的,但是自己做还是遇到了很多实际的细节问题,后面再把详细的过程贴出来
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    1

    主题

    18

    帖子

    0

    注册会员

    Rank: 2

    积分
    99
    最后登录
    2018-7-9
     楼主| 发表于 2018-6-8 01:11:24 | 显示全部楼层
    okwh 发表于 2018-6-6 09:55
    这个确实不容易, 上次有位就做了个简单的,可参考
    https://www.nxpic.org.cn/module/forum/forum.php?mod=view ...

    今晚测试了一下,程序可以简单的识别连续的声音,但是对于单字的识别准确率不高,可见也许声音录制的时刻也很重要,这方面应该有一些细节没有考虑到,另外识别的声音长度更长也许有帮助,怪不得一些智能音箱的关键词比较长,估计也有这方面考量。目前的参数如下:
    模板长度:18*16ms = 288ms
    录音长度:25*16=400ms
    MFCC滤波器个数:26个
    MFCC因数长度:12
    是否包含帧信号能量:否
    是否有一阶和二阶做差(delta)处理:否后续工作:1. 测试更长的语音长度;2.优化参数,加入做差处理(delta)

    点下面的红色“视频”可以直接访问优酷视频网址哦~
    视频:

    程序请见附件。
    SDK_2.3.1_LPC54114J256-VoiceRecognition-20180608.zip (15.99 MB, 下载次数: 49)
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2021-7-5 15:45
  • 签到天数: 664 天

    [LV.9]以坛为家II

    42

    主题

    1594

    帖子

    19

    金牌会员

    Rank: 6Rank: 6

    积分
    5382
    最后登录
    2021-12-22
    发表于 2018-6-8 09:41:39 | 显示全部楼层
    这已经很牛了啊!!! 这真心不容易。
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 注册/登录

    本版积分规则

    关闭

    站长推荐上一条 /4 下一条

    Archiver|手机版|小黑屋|恩智浦技术社区

    GMT+8, 2024-4-27 01:45 , Processed in 0.135820 second(s), 24 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2024, Tencent Cloud.

    快速回复 返回顶部 返回列表