深圳市艾礼富红外技术有限公司

Contact

地 址:深圳市南山区西丽松白路1055号丽河工业园二栋三楼
电 话:0755-88822665
传 真:0755-88822665-8016
邮 箱:sales@szaleph.cn

分享到:

联系我们

行业新闻

You are here:Home > 新闻中心 > 行业新闻
模板质量难以控制 声音识别发展举步维艰
Author: Published on:2012/10/23 16:15:55 Traffic:
常用的指纹识别,掌形识别,或者我们经常见到的人脸识别和虹膜识别等等,已经早已经渗透到我们的正常思维中。若说起声音识别,恐怕大家的了解程度就不像之前那些那么高了。尽管在我们当前的日常生活中,利用声音工作的设备也不在少数,但是如果要说借助声音来识别身份,好像还真没有什么地方在用。声音识别是什么形式?声音识别的发展为何举步维艰?
  
  声音识别的工作方式
  
  其实,声音识别这项技术一直就是我们生物识别应用中的一个重要的研究方向。由于每个人的声带系统都具有不同的特点,所以提取这种差别,放大他们的不同,则成为我们借助声音进行身份识别的主要方向。
  
  在工作过程中,人的声音通过拾音器拾取后,特征参数提取单元检索出表现声音信号的声学特殊参数,经计算机声学模型的处理,使之成为与声音数据厍所贮存的声纹图谱相同的模式,然后用新采集的与贮存的声音模板进行对比识别,最后输出识别的结果。得出这个被判断的对象是否可以允许通过。
  
  在这个识别过程中,计算机首先要根据人的声音特点建立相应的声音模型,对输入的声音信号进行相应的分析,并且抽取其中的重要特征,在此基础上建立声音识别所需的模板。而计算机在识别过程中要根据声音识别的整体模型,将计算机中存放的声音模板与输入的声音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的声音匹配的模板。然后,据此模板的定义,通过查表就可以给出计算机的识别结果。
  
  显然,模板质量的好坏则直接关系到了声音识别的准确程度,甚至可以说是识别的核心。那么,声音识别的举步维艰难道仅仅是因为模板的问题吗?
  
  声音识别应用为何举步维艰?
  
  人体声音的易变性
  
  诚然,声音识别技术在信息处理的过程中,已经有了一套非常完善的技术识别系统,并且在我们的应用中还会得到不断的完善。不过,虽然在识别过程中,先进的技术早已经成为应用的保障。但是在声音的源头我们是难以控制的,同样更是计算机难以控制的。当人的声音随着自身的年龄或者身体状况发生改变时,相应的声音识别系统却并不能聪明的有了更新的认识。或者可以不夸张的说,我们甚至有可能因为自身的感冒或者身体的不适而被关在门外。而这种看似非常滑稽的事情,在声音识别的应用中,却是再正常不过的事情了。
  
  模板质量的难以控制
  
  除了生源本身的变化以外,模版的质量也是关系到了声音识别效率的高低。在模版的搭建中,为了能够获得一个承载性更强的模版,往往需要有大量的原始数据来寻来设备的应用模型。因此,在开始进行声音识别研究之前,首先要建立起一个庞大的声音数据库,并且不断的调整系统模板的参数,使其尽可能的向着最佳的状态靠拢。而这个过程,则需要计算机拥有强大的算法作为支持,并配有完善的技术指导,才能达到很好的效果,而这些也都是目前技术下所欠缺的。
  
  音色的可模仿性
  
  无论是针对指纹识别还是人脸识别,鉴别真伪的能力都会被作为设备的一大主推点相应的推出。而对于声音识别来说,针对伪造声音的设防却是声音识别设备当前的主要瓶颈之一。由于不像实物识别那么拥有更加明显的特征,而且具有相对容易的取样可能。所以,在当前这个音频技术如此发达的环境下,如何判断这个声音的确是控制人员本人,恐怕是至今依然难以彻底攻克的一个难题。而这也是给声音识别用户留下的最大牵挂。
  
  通过上面的分析我们可以看出,虽然同样作为生物识别的重要组成部分,但是由于重要特征的难以把握,以及在声音处理技术上的复杂性,因此声音识别的应用至今还依然停留在一个相对初级的应用阶段,暂时还难以像其他生物识别技术那样委以重任。
  
  不过,声音识别对于我们来说并非是没有前途的。随着当前在法律审判,公共安全等重要环节的屡屡应用,本身就是对声音识别技术的一个循序渐进的尝试与发展。正是在这样的实际应用下,使声音识别技术本身没有因此而被放弃,反而还得到了不断的补充与提升。所以,尽管声音识别在当前还处在一个相对蛰伏的阶段,但是我们何尝又不能期待未来的它将会以一种新的惊喜出现在我们的生活当中呢?

在线客服

销售员1号
点击这里给我发消息
销售员2号
点击这里给我发消息
销售员3号
点击这里给我发消息
销售员4号
点击这里给我发消息
销售员5号
点击这里给我发消息