（三）基于C55xx C674x 和 PCM1864 语音识别前端语音处理解决方案(3)

本课程为精品课，您可以登录eeworld继续观看：
（三）基于C55xx C674x 和 PCM1864 语音识别前端语音处理解决方案(3)
登录

课程目录
课程笔记

同时TI也在做一个限震的板子现在还没有发布正在安排生产的事情很快就会发到TI的官网上作为前期评估的发布是自己开发的方案（听不清）就不需要自己去单独做一个（听不清）做评估这个如果真要去做的话可以先考虑等线阵对等线阵出来之后先考虑线阵会好一点如果就用这个防震的话建议你不要选5517 而是选C674X的板子 C6747 48 的那款选那个板子为什么呢因为我的5517只有总共只有三个FS 总共就有三个FS 提供最多就只是6个麦克风所以我这里面防震的板子是 7+1的（听不清）所以说里面有几个孔没连进来没连进来的问题无非就少几个麦克风是吧（听不清）从8个里面选4个问题是我的enforcement效果就没有了因为enforcement一定要有是对称的这个7+1你是选不出四个对称的麦克风的所以效果是很不好的跑出来的效果是很不好的所以防震这个板是硬件是可以连的但是从算法的角度它是不匹配的简化程序处理因为像我们demo里面提到这种这个 KWS也就是关联置换器关联置换器这块我们用的是（听不清）里的识别引擎这是一个第三方公司好像现在apple的后面目前好像听说是用了它的反正就是像（听不清）好像也是用的它的就是很多家用的都是这家的识别引擎因为它十种语言各种语言都支持像TI自己做了一个那个只是英文好像我们本国去做的话就会做一个只支持中文的这家公司提供的是多语言都支持他的语言看你的需要 (听不清)这也是一个需要考虑的问题这个是语言它一个特点是这个东西需要的数据能力很低不需要很强的数量（听不清）我感觉就10兆的（听不清）一点点数量就可以了从TI的（听不清）从哪里开始如果去做语音识别的话首先算法我说了一个是前处理后面是识别前处理就包括了东西（听不清）这是一个波回声消除这些（听不清）东西都对（听不清）没什么关系对不对但是基本的一些 voice speech的基本的算法都是降噪的都是基本的算法这些算法其实在TI一直有（听不清）苹果数据像电子屏幕（听不清）FP 这个都是可以用的这是TI优化好的（听不清）是整个算法里面需要的然后像和AEC里面的话包括这些帧页控制（听不清）动态范围压缩（听不清）是后来加进去的加到这里边去的做这个东西把（听不清）加进去的在（听不清）然后VO内部有语音检测像VIP TI的VIP的时候的一个库 TI以前在VIP上面大家知道以前打电话都需要华为的语音广播就是TI的东西（听不清）也是TI的所以这些算法 TI来说一直是有只是说其实是在12年的时候 TI就在做这些东西只是说做早了一步那时候也有些其他的公司在做比如说（听不清）这个市场那时候还没火起来市场火起来就是因为那个亚马逊的Echo 这个应用把它火起来这个技术其实一直存在因为我记得大概在2000年的时候手机三星的手机就有语音拨号功能就算手机有识别能力对吧就说语音识别这个东西并不是一个新鲜的技术它一直都有只是这个应用做成一个产品这是一个这两年一个由亚马逊的Echo引燃起来的的APP 点燃起来的手机里 100（听不清）或者200（听不清）近距离电话号码用到各种智能家居上面的话可能要把它跨远一点远距离啊这是语音识别的是TI可以在网上可以下载的EI ESR 它只是英文（听不清） TI的demo是集成的这个因为它是如果要用它的话就直接取代连接器就好了因为它始终这个东西只是从网络上看的话它只是制作这个东西没有识别引擎另外一些通用的speech的部分就是（听不清）这样的一些部分 TI在网上可以下载另外像访问云的时候需要的OPUS格式的话也是TI的网上公开可以下载的所以说 TI能够提供基本上都能提供只是说效果好不好大家可能需要去把它产品化的时候可能还要去做一些工作基本的算法组件 TI都提供另外这些东西就是相应的访问软件包（听不清）无线的CSL GPL TI的（听不清）的软件包而且我们这些功能是针对各种平台我们都有相应的版本比如C5000 C6000等等我们都有PI的版本可以免费下载安装完一个目录的结构这是SD的一个结构这是AEC 这是我们的demo提供的里面的东西软件的东西 K2G 专门为这个做的一个demo demo可以用软件包的方式你是对它说话然后呢它把没处理过的和处理过的存下来可以在比较处理前后声音的一个对比噪声的情况这是回声消除库大家可以看到回声消除库里面包含很多东西很多东西在这里面每一个对我来说都是比较复杂的因为我不是做算法的因为你是做算法的就会看到这里的东西是一个很好的一个起点因为 EQ也好还是动态范围压缩也好只是（听不清）你如果都要自己去写的话当然如果你是一个有积累的公司在这方面有专长的话那可能是一回事如果不是有专长的话那你可能仅仅是实现可能效果或者性能的对比都是一个很大的挑战 TI的这些东西都是经过一些成熟的应用验证过的算法的效果最起码是可以接受的可以说是业界最好的它是厂家已经接触过的产品应用上的这是我们的一个design tools 因为前面说了一个（听不清）麦克风的摆放以及距离它都有关系参数会不一样我们就是说（听不清）的一个工具里面就是说输入你的采样率啊几个麦克风啊麦克风的摆放位置是方形圆形还是线性的这些参数给它之后它会生成这就是对应这个图的一些设置项目会生成一大部分的performance的参数这个把参数放到（听不清）到文件里面重新编译会变成这样的（听不清）就可以了同时这个文件里面是对应的几个麦克风一些参数这个也在TI的文档里面有一个pdf文件里面告诉你了（听不清）的图片该怎么用以及哪些参数怎么修改硬件就是我们几种目前来说当然不是说别的不行你用M57那也可以关键是说你的ARM来干什么然后做产品选一个最接近应用需求的一个最便宜的方案这是一个最靠谱的选择这个呢大家可以看它输出的时候是一个左右震荡当然是左还是右就是一个是处理的一个是没处理的像上面这个噪声像这个就会干净很多这个是处理完的这个没处理这个是我们的前面提到的几款芯片的大致情况像5517 我们目前来说是C5000里面性能最高的一款（听不清）的CPS芯片 C5000的主要特点就是低功耗另外我说不出它有什么优点毕竟相对来说它的处理性能会不如C6000 C6768这是一个系列外设分布很多而且（听不清）支持16个MS 而且是EDR 它的处理也高一些另外功能的外设包括显示等等（听不清） USB 做这些应用呢做全处理它是一个性能比较适中的芯片选择可以做6个麦克风以上两到四个麦克风（听不清）也就差不多了这是K2G K2G的特点是它有一个A45的ARM 所以（听不清）的处理能力也高很多处理能力很强它需要一个强的ARM来做其他应用特别适合选（听不清）K674X还是K67 这是简单的芯片的细节没有必要去一个一个过总结一下就是我 TI 这个应用里面这个语音识别（听不清）低光敏的和降噪（听不清）选择DRC 回声消除这一块 TI都有现成的软件库以及demo 硬件没有了如果是对这方面应用感兴趣的可以在TI的平台上有一个好的开始它是不需要自己去想有一个好的开始这就是我的topic的大致这些内容

课程介绍共计6课时，2小时35分23秒

基于 TI 高性能处理器的解决方案

TI 处理器解决方案

猜你喜欢换一换

推荐帖子

放大器具有高 PSRR，就不需担心电源变化?:        电源抑制比 (PSRR) 主要说明运算放大器对电源电压变化的抑制效果。PSRR 的定义是每伏电源电压变化的失调程度，单位通常为微伏每伏 (uV/V)。         例如，OPA209 的典型 PSRR 是 0.05uV/V。因此对于 OPA209 来说，电源变化 1...; Aguilera 模拟与混合信号

交通灯智能控制系统设计: 1.概述     当前，在世界范围内，一个以微电子技术，计算机和通信技术为先导的，以信息技术和信息产业为中心的信息革命方兴未艾。而计算机技术怎样与实际应用更有效的结合并有效的发挥其作用是科学界最热门的话题，也是当今计算机应用中空前活跃的领域。本文主要从单片机的应用上来实现十字路口交通灯智能化的管理，用以控制过往车辆的正常运作。 2.过程分析 &nbsp...; fish001 微控制器 MCU

这可能是最好的模拟工程师电路设计指导手册（内含运算放大器等文章汇编）: 这可能是最好的模拟工程师电路设计指导手册 + 有关运算放大器设计主题的博客文章汇编   为了简化和加快系统设计，TI的《模拟工程师电路设计指导手册》提供了一个全面的子电路设计理念书库，您可以轻松借鉴书中的理念来满足您的特定终端设备需求。每个电路都是一个"食谱"，其中包括分步说明、基本公式、原理图和仿真。   运...; eric_wang 模拟与混合信号

TMS320C6711串行通讯初始化程序: 　TMS320C6711与TMS320LF2407进行串行通讯的软件设计难点是McBSP与SCI的初始化程序设计。初始化程序包括对芯片的管脚配置、通讯模式配置和中断配置等方面。以下分别给出TMS320C6711的McBSP模块和TMS320LF2407的SCI模块的初始化程序模块。     (1)TMS320C6711的McBSP模块初始化程序  &nb...; fish001 微控制器 MCU

（三） 基于C55xx C674x 和 PCM1864 语音识别 前端语音处理解决方案(3)

（三）基于C55xx C674x 和 PCM1864 语音识别前端语音处理解决方案(3)