- 本课程为精品课,您可以登录eeworld继续观看:
- TI C674X DSP 语音信号处理方案及语音识别三要素
- 登录
- 课程目录
- 相关资源
- 课程笔记
现在介绍一下TI C674X语音信号处理前端
这个是通过这框图我们可以看到C674X
是通过TI的麦克风正列
麦克风正列进入TId ADC
然后把ADC通过FRS接口输入到C674X
然后通过FRS传给我们的RM
前端 RM再通过
Ylink chip WiFi 通过源传出到云端
整个链路你看到基本上红色的这条线路
是检测关键字
我们一般称为KWS
蓝色的这一边一般是云分析命令以后
反馈服务或者是反馈回你需要播放的内容
语音信号前处理包括
很多前处理的算法
在这里简单给大家介绍一下
像回声消除 信号接入以后一般都会进入回声消除
这跟你的麦克风的个数也有关 比方说
你要做4麦或者6.1环正
或者是8.1 甚至双环正
等等 这些环正进入以后 一般都是每个
麦克风都要做一路AEC
做AEC以后像波速成型
bean forming 声源定位DOA
然后也要做降噪 dereverberation
也要做去混响 最后要做AGC
这样处理以后 基本上人是在
1米到10米之内你随便
站在哪一个地方 我们听到的声音是恒定不变的
除了这些算法以后 我们还会
做一些只能待语音交互
比方说大家可以看到很多语音合成
刚才KWC已经介绍
那么本地的语音识别
ASR 或者是声纹识别
SPR这个都是各个公司想要较劲的
或者是核心技术所在
我们现在介绍一下语音识别以及唤醒的性能
语音识别方案的好坏其实有三大要素
第一个是唤醒率 第二个是误唤醒率
第三个是识别率
左边这个测试项目大家可以看一下
它的参数是我们从TI的以下第三方
拿到的数据
也可以看到 从误唤醒率
现在是1-3 一次到两次每天
其实亚马逊的测试标准是3次每天
也就看到这个标准是低过亚马逊
是低过亚马逊的测试标准
符合亚马逊的要求
看到其他一米
或者三米的语音识别率
都达到95%
KWS 1米的唤醒率甚至高达99%
这个测试条件我相信大家
它是有本地语音识别
有50条内置磁条
测试是采用第三方6+1的迈克阵列的环阵
课程介绍
共计3课时,14分26秒
猜你喜欢
换一换
推荐帖子