TI 甘为 AI 大脑的顺风耳.P2

本课程为精品课，您可以登录eeworld继续观看：
TI 甘为 AI 大脑的顺风耳.P2
登录

课程目录
相关资源
课程笔记

参考设计

基于 C5535 eZdsp™ 的语音识别参考设计采用 66AK2G02 且适用于基于语音的应用的音频预处理系统参考设计

云处理我们今天的Topic主要是指（包括TI）前端前处理因为后处理主要是一个AI的算法或者说是云端所以说语音识别的应用上各有专长因为它有这个专长的话就随便找那个ARM或者说用云端吧就不需要专门来说这个事情就是这个应用技术的关键点或者说是瓶颈其实是在前处理这是大家来区分产品好坏的一个关键点谁前处理做得好谁的产品比如说识别率优化率这些指标就会更好基本上是这么一个概念前处理从TI能提供的芯片的device来说我们有两个方向可以选择一个是C5000的低功耗一个低功耗一个是C6000高性能 C5000的低功耗呢当然因为我们的主频限制50M或者到200MHz 目前我们的C5000是这么一个水平所以说你要做很多Micro 或者说很多功能都加进去的话可能不一定够就是说你要去权衡你加进去的一些算法以及Micro数啊做一个权衡是选C5000够不够的这个问题需要进一步的确认当然首先你低功耗要求比较苛刻的话可能就只能在C5000里面来做选择只能在基本的功能上做一些平衡有些你想的很好的功能可能就不能搬进去了 C6000就是高性能高性能呢 C5000和C6000虽然都是TI的DSP但他们之间是没有间隔性的因为芯片的架构完全不一样则连接不一样基本上从理论上 C6000 C5000有可能是一个同频4倍以上性能的提升 C6000目前我们主打的是 C6743 它其实在C6000里面也算是低功耗的产品主频最高456M 片刻内存也还可以有三百多K 它的I2S接口就是说MCASP我们有16个脉也就是说可以支持16个通道的I2S 其中的方向是灵活可配的所以基本上对Micro数没有限制 TI基于C5000 C6000我们做了一个TI Designs 就是说仓口设计就是硬件基本上一般是基于开发吧这个设计主要是软件大家如果有这个power板的话可以下载它的软件下来试一试这里面的软件包括Voice Trigger也是TI的一个识别但它指的是英文回声消除其实回声消除很多产品下大家都有这个需求当然因为它不是一个简单的概念回声消除涉及到各种指标的一个需求比如说你的延时长度比如说回声你要消的是D级声还是单声道这都不一样所以它里面很多需要调整所以说用EC的话大家需要有这方面的一个知识背景当然如果你有这个知识背景再去看我们提供的算法用起来会方便一些如果不懂这方面的话用起来还是会有些你需要去研究的地方前面是C5000的Voice Trigger一个简单的参考设计这里讲的是基于我们的语音识别预处理的一个参考设计算法不一样就把前处理这一块都换进去了这是基于C6000K2G做的同样的一套前处理的一直到KWS 就是有关进制唤醒这一部分的软件这个图这个硬件中间是一个K2G的原板左边圆形的是我们一个环形的麦克风阵电这个都在我们的官网上可以直接订购如果有兴趣需要拿来评估的话因为其实做一个语音识别系统的话这个麦克风阵电摆放的位置等等都是有讲究有要求的我们的这个麦克风把是一个7+1的环阵中间一个作为一个参考麦克风作为17个我们也会有一个4Micro的线阵就是直的线阵然后很快也会放到网上来然后这个环阵呢可以跟我们的SK2GCDU74X以及C5517开发板都可以连接我们提供的相应的TI Designs的软件包就是直接可以在上面弄可以看到效果可以去调整你的算法可以加入你们的算法左边这个黑色的4个Micro就是我们马上要推出的4个Micro的线阵因为针对于不同的产品有的比如说你的产品是放在桌子上的那肯定需要一个环阵要360度去唤醒它或者去跟它通讯交流比如说挂在墙上的产品比如说空调电视机等等一般放在墙上的产品的话它就不需要四格环阵不是360度是180度的所以线阵就可以了这样效果会更好比如说现在你的beamforming的话你拿到的比如说是4Micro的话你只是4个Micro的beanforming的一个提升环阵的话一般来说你一个对角线这种的话就是中间有一个你就是对角只有三个麦克风拿到的信号的能量是不一样的所以真正的线阵比环阵效果可能还要好一些我们的这个demo里面就是那个KWS 就是说唤醒那一块唤醒那一块用的是第三方的这个唤醒用的是第三方的因为它支持各种语言 sensory 它是一家专门做唤醒或者说语音识别的一家公司它不做前处理它只做识别这一块目前很多这个语音识别的产品里面用的其实很多都是sensory的当然慢慢的也会有很多其他家也做得很好的这里只是声明一下里面做的那个因为后面假如用TI的平台用到这一块的话呢因为后面识别的这一块还是要自己去跟sensory去谈的因为不是TI的这个图呢就比较清晰了就是说这个从声音信号进来的流程到一些算法的流程左边是声音比如说 1到8Mic的这种那个板是八个Mic 最终用户你可以比如说4Mic比如说6Mic 都无所谓声音信号进来之后经过做beamforming算法如果是说还要做AEC的话有可能在beamforming之前就要做一个AEC的因为每个麦克风都采集了你放出去的声音如果你有本地扩音这种产品的话在做AEC板的时候你有多出多少个麦克风通道就要做多少的路的AEC 可以说这个处理量是非常大的在beamforming 在做这个支持云降噪看你是用哪种的算法 TI我们也有算法来做你自己实现了之后你可能得出一个相对比较干净的信号然后再来从选择是哪一路麦克风或者是哪一路方向的beamforming信号作为最终输送去做识别引擎这是sensory大家可以去它的网站上去了解它基于哪些平台或者是做的哪些语音识别方面的一些成功案例大家现在在TI的平台上是做了C5000版本的移植我们后面也在做C6000版本的移植这是目前TI在TI Designs 在自己的平台上评估下来的一个性能需求所以从这里可以看到我们的比如说C5535到C5517 各适合于做多少个麦克风阵列预处理需要多少的处理能力以及内存大小不过这个表里面是没有包括AEC的算法进来因为不是所有的产品都需要AEC 只有那种本地有回放的才需要AEC 如果加AEC的话就还要考虑到几个通道AEC的处理能力以及内存需求这个表加上了KWS的唤醒就语音识别的唤醒值这部分的内存需求那就是说如果选择TI的平台那如何开始 TI的平台就是C5000 C6000 K2G开发板以及CNB麦克风硬件板软件TI到底提供哪些东西就预处理需要哪些一般来说是包括哪些算法 TI的以及提供的情况如何首先就是说 DSP库 DSP库就是那些ft ift以及fir等等这些录合器这些都是在DSP库里面不管C5000 C6000TI都做了不同版本的提供可以在官网上直接免费下载还有AEC 就是AEC以及AER 这里面包括自动阵列控制均衡等等动态范围压缩声音降噪都放到一起了你可以在TI的官网上直接搜搜到它的链接还有VoLIB 里面包括一些voice的检测以及语音增强这是做VIP的一个库 VIP的一个库里面包括一些跟语音相关的VIP也是跟voice相关的就是预处理它不是一个单一的概念就是我们提供的前面这些当然不仅仅是这些可能你还有更多的自己的想法来实现一些其它的算法来提高你的处理或者效果因为它不像一个标准比如说打个比方比如说264264它就公式给你的就是把一个low data转成264的文件而预处理它不是这样就包括video做图像预处理也是一样的一个道理它不是一个标注格式的东西你可以加很多很多自己的算法进去也可以 TI提供的很多已经提供的大部分的通用的一些算法用TI的平台可以有一个很好的开始 OPUS这是指你处理好的声音你要是交给云端做一个打包 dm码打包交给云端去识别的一个格式

课程介绍共计4课时，2小时6分10秒

直播回放：甘为AI大脑的顺风耳

DSP 语音识别 AI

语音识别的发展可谓飞速。当下，诸如科大讯飞、百度等多家企业声称，其研发的云端语音识别技术已经达到了97%的准确率。谷歌、苹果和微软等多家科技巨头都公布了自己在语音识别上的进展和突破，语音识别也将是2017年的发展重点之一。那么让这些AI 有一双听得清听得远的耳朵是多么的重要，运用TI DSP 的语音前端处理技术在实时会议系统，和非实时的智能音响，智能家电，智能汽车的应用。

猜你喜欢换一换

推荐帖子

AFE4400采集脉搏: 本帖最后由 wufeijian 于 2015-4-27 17:47 编辑已经用AFE4400开发将近2个月了，遇到了好多的问题...; wufeijian 模拟与混合信号

当低EMI电源遇上拥挤的电路板，你该怎么办？: 本帖最后由 qwqwqw2088 于 2019-11-15 08:20 编辑        有限且不断缩小的电路板空间、紧张的设计周期以及严格的电磁干扰(EMI)规范（例如CISPR 32和CISPR 25）这些限制因素，都导致获得具有高效率和良好热性能电源的难度很大。在整个设计周期中，电源设计通常基本处于设计过程的最后阶段，设计人员需要努力将复杂的电...; qwqwqw2088 模拟与混合信号

细数T-BOX中TI的明星产品之车载以太网 | 第一节 DP83TC811S-Q1：车载以太网让您的T...: 第一节 DP83TC811S-Q1：车载以太网让您的T-BOX如虎添翼近年来“车联网”概念的热度一直都居高不下。说起车联网，当然就不得不提车载以太网以及车联网的核心组成部分之一---T-BOX！本文将会从车载以太网100BASE-T1说起，深入剖析车载以太网特点，并且详细介绍TI的明星产品DP83TC811S-Q1的优点以及在T-BOX的应用中的优势所在。 ...; alan000345 TI技术论坛

MSP430 - G2553之串口操作: #include <msp430.h>   void delay1s(void)  {   int t = 1000;   while (t--)     __delay_cycles(1000);     }   #define UART_TXD 0x02   &nb...; Aguilera 微控制器 MCU