查看: 5023|回复: 10

【RT1052】4、rt-thread 语音识别接入百度AI平台

[复制链接]
  • TA的每日心情
    开心
    2021-4-13 21:11
  • 签到天数: 550 天

    [LV.9]以坛为家II

    14

    主题

    1049

    帖子

    5

    金牌会员

    Rank: 6Rank: 6

    积分
    2417
    最后登录
    2022-6-16
    发表于 2018-11-13 18:32:01 | 显示全部楼层 |阅读模式


        上周为了直接用百度语音识别的sdk(c++),折腾了一周curl和json的移植,结果各种编译问题,搞得头疼。遂放弃官方sdk,直接分析数据和协议,再用用rt-thread已有的组件,进行协议解析与组包,一下子豁然开朗了。话不多说,直接上图,可以看到图中三次结果都是正确的
        0.png


        一、语音识别的平台选用百度ai开放平台(主要是因为完全免费),参考百度ai平台的官网的新手指南注册并创建应用,创建好的应用有两条内容在下面会用到,如下图:
             1.png


        二、ok1052相关的工作
            1、通过env添加webclient、cjson、mbedtls组件,添加方法参考之前的帖子,具体配置如下图

                 2.png


                 3.png


                 4.png


            2、添加两个宏到rt-thread\components\net\lwip-2.0.2\src\lwipopts.h,见下图
                    5.png



            3、编写sound_test.c文件,主要有三个部分:获取百度ai平台token、实现语音上传及结果获取、语音数据采集及应用逻辑实现。
                a、获取token,函数webclient_get_token,实现方法参考语音识别中的token获取方法;
                    10.png


                b、实现语音上传及结果获取,函数webclient_post_pcm,实现方法同样参考语音识别音频格式为raw,单声道,16K采样率pcm文件
                    11.png


                c、语音数据采集,在上一篇帖子中已经实现,应用逻辑为当按键按下时采集语音,数据达到最大长度或按键抬起会结束采集,之后发送到服务器并等待结果。


        三、相关代码及用法
            1、代码: imxrt1052-evk.zip (1.54 MB, 下载次数: 80)
    哎...今天够累的,签到来了~
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-1-31 22:07
  • 签到天数: 29 天

    [LV.4]偶尔看看III

    20

    主题

    385

    帖子

    19

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    1680
    最后登录
    2020-7-1
    发表于 2018-11-13 18:46:22 | 显示全部楼层
    相当棒的demo, 多谢分享。
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-4-13 21:11
  • 签到天数: 550 天

    [LV.9]以坛为家II

    14

    主题

    1049

    帖子

    5

    金牌会员

    Rank: 6Rank: 6

    积分
    2417
    最后登录
    2022-6-16
     楼主| 发表于 2018-11-13 19:10:52 | 显示全部楼层
    1209实验室@ujn 发表于 2018-11-13 18:46
    相当棒的demo, 多谢分享。

                
    哎...今天够累的,签到来了~
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-3-29 09:54
  • 签到天数: 418 天

    [LV.9]以坛为家II

    21

    主题

    2928

    帖子

    0

    金牌会员

    Rank: 6Rank: 6

    积分
    3307
    最后登录
    2021-4-7
    发表于 2018-11-13 19:27:06 | 显示全部楼层
    666多谢分享。
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2021-2-4 09:24
  • 签到天数: 190 天

    [LV.7]常住居民III

    38

    主题

    591

    帖子

    28

    金牌会员

    Rank: 6Rank: 6

    积分
    2193
    最后登录
    2023-12-1
    发表于 2018-11-13 20:30:16 | 显示全部楼层
    好东西 学习
    哎...今天够累的,签到来了~
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2021-9-9 22:51
  • 签到天数: 415 天

    [LV.9]以坛为家II

    79

    主题

    3088

    帖子

    21

    金牌会员

    Rank: 6Rank: 6

    积分
    5181
    最后登录
    2022-5-23
    发表于 2018-11-13 21:46:59 | 显示全部楼层
    厉害厉害,学习下,赞赞赞!
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    4 小时前
  • 签到天数: 818 天

    [LV.10]以坛为家III

    71

    主题

    2444

    帖子

    24

    金牌会员

    Rank: 6Rank: 6

    积分
    5513
    最后登录
    2024-4-23
    发表于 2018-11-30 10:51:57 | 显示全部楼层
    谢谢分享,厉害,跟着学习
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-29 10:09
  • 签到天数: 40 天

    [LV.5]常住居民I

    0

    主题

    77

    帖子

    1

    中级会员

    Rank: 3Rank: 3

    积分
    285
    最后登录
    2022-1-27
    发表于 2018-12-3 16:18:41 | 显示全部楼层
    真棒,有空我也试试看
    哈哈哈
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    0

    主题

    1

    帖子

    0

    新手上路

    Rank: 1

    积分
    15
    最后登录
    2019-3-1
    发表于 2019-2-21 18:11:29 | 显示全部楼层
    我看您wm8960驱动程序中,音频协议是32位左对齐的数据格式,采样率是44.1kHz,百度语音识别需要的是语音文件是音频格式为raw,单声道,16K采样率pcm文件,您这个通过mic采集音频后,是怎么转变成百度语音文件需要的音频格式呢?我在您程序中没有找到音频转换的程序,我的想法是把wm8960设置为pcm的音频协议,采样率设置为16k,不知道我理解的对不对,希望得到您的解答,谢谢
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-4-13 21:11
  • 签到天数: 550 天

    [LV.9]以坛为家II

    14

    主题

    1049

    帖子

    5

    金牌会员

    Rank: 6Rank: 6

    积分
    2417
    最后登录
    2022-6-16
     楼主| 发表于 2019-2-25 09:54:52 | 显示全部楼层
    晴天小熊 发表于 2019-2-21 18:11
    我看您wm8960驱动程序中,音频协议是32位左对齐的数据格式,采样率是44.1kHz,百度语音识别需要的是语音文 ...

    raw是原始数据 直接把内存里的数据上传就行  不需要转换格式
    哎...今天够累的,签到来了~
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 注册/登录

    本版积分规则

    关闭

    站长推荐上一条 /4 下一条

    Archiver|手机版|小黑屋|恩智浦技术社区

    GMT+8, 2024-4-23 15:31 , Processed in 0.151128 second(s), 31 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2024, Tencent Cloud.

    快速回复 返回顶部 返回列表