免费论文查重认准CNKI论文查重,专为高校论文检测、毕业论文查重、硕士论文查重诞生的论文检测入口平台,CNKI论文查重系统涵盖海量的数据库,为毕业生解决各种烦恼,论文查重软件免费为各种有论文检测、论文查重需求的人提供,论文查重认准CNKI查重!
发布时间:2023-02-22 17:50:31 作者:知网小编 来源:www.it54.cn
声纹识别的理论基础是每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分。 这种独特的特征主要由两个因素决定,第一个是 声腔的尺寸 ,具体包括咽喉、鼻腔和口腔等,这些器官的形状、尺寸和位置决定了声带张力的大小和声音频率的范围。 因此不同的人虽然说同样的话,但是声音的频率分布是不同的,听起来有的低沉有的洪亮。 每个人的发声腔都是不同的,就像指纹一样,每个人的声音也就有独特的特征。 第二个决定声音特征的因素是 发声器官被操纵的方式 ,发声器官包括唇、齿、舌、软腭及腭肌肉等,他们之间相互作用就会产生清晰的语音。 而他们之间的协作方式是人通过后天与周围人的交流中随机学习到的。 人在学习说话的过程中,通过模拟周围不同人的说话方式,就会逐渐形成自己的声纹特征。
目前的声纹鉴定方法,简单讲分为两种:一是目前我国司法实践中普遍应用的"人工鉴定"——专家鉴定人依靠语音学方法,二是未来发展方向的"自动鉴定"——计算机通过算法来模拟人耳对声学特征的提取、训练、对比来实现。 那么“变声器”是什么高深的玩意儿呢?
虽然深度学习带给模式识别极大的提升,甚至还有开源的相关算法,但是声纹识别的研究进展仍然不大,这仍然受制于声纹的采集和特征的建立。 先看噪声问题,下图是Mitchell McLaren在论文中做的研究,噪声对不同模型的声纹识别影响。 从这个图中可以看出,混响和噪声对各类模型和方法都有非常大的影响,这和人类似,嘈杂环境中确实很难分辨出某个人的声音,但是人耳比较奇特,我们可以很好的处理这种“鸡尾酒会”效应,但是目前机器还做不到。 音乐噪声很好理解,因为音乐通常是宽带信号,完全覆盖了人声的频段,这会非常影响声纹的特征表现,动态检测的时候更是难以提取,我们目前在语音识别中采用的是回声抵消的方法(严格来说是自噪声去除),同样也可以用到声纹识别,但是面对其他设备音乐也很难处理,当前仅有波束形成这一方法。
美国和国内都有不少企业生产声纹识别的设备,公安部为采购这些设备还正式颁布了《安防声纹识别应用系统技术要求》的行业标准。 但是这种方法是一种静态检测的方法,存在很大的弊端,实时性不好,动态检测声纹的需求实际上更大。