低资源文本相关的声纹密码识别方法的研究开题报告

 2022-11-24 08:11

1. 研究目的与意义

作为说话人识别的一种最典型的应用,声纹密码通过文本内容与说话人的声道信息两个途径来保护说话人的信息安全,即使是目标说话人,在下一次登录应用系统时,说出的内容必须与注册时一致,才能被系统确认。因此具有很高的安全性,被广泛应用在众多行业中,为个人财产以及企业的安全带来极大的便利,也可以为国家安全,司法案件等带来了鲜明有力的证据。但是由于一些不确定性因素,如年龄、情绪、成长环境、噪音等的影响,声纹识别技术还有待于继续深入挖掘和研究,进一步提升其基础理论和应用价值方面的研究水平。声纹识别即说话人识别,本质上它是语音信号模式识别领域中的一类问题,主要包括声纹特征提取、语音特征训练和语音分类识别三个部分,其中声纹特征提取是整个声纹识别系统的核心和关键,它关系整个系统的性能。

从学术上来看,声纹密码系统可被认定为一种文本相关的说话人识别。采用隐马尔可夫模型(HMM)来对文本的相关性进行建模,考虑到声纹密码一般都很短,采用UBM的方法来弥补数据的不足。采用全部声韵母的HMMs作为UBM模型,可在说话人注册和识别时候更加灵活地设置不同的密码。

本设计将主要解决低资源环境下,文本相关的声纹密码识别的模型建立,实验并分析模型的识别能力。并通过本次实验学习隐马尔可夫模型,自适应模型建立方法等方面,检测自身MATLAB,Python等软件掌握情况。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

深度神经网络模型作为机器学习理论的一个重要分支,使机器具有像人脑那样感知和学习外部信息的能力,并能通过自主学习准确识别符号,音频和图像。将这一理论与声纹识别等实际具体问题相结合,不仅可以加深我们对语音信号从产生,传播到理解的全过程的理解,而且可以从根本上解决语音纹识别的各种问题。然而,基于DNN的声纹识别系统仍然受到伪造者的攻击,特别是那些故意侵入的高保真设备记录的声音。对于DNN模型本身算法没有提出解决这一问题的方法。而引入二阶决策结构,综合考虑了一阶决策向量的所有数据的大小和分布,提高了深度神经网络对冒名顶替者的拒绝率,增强了系统的鲁棒性。

难点:

1.语音信号处理方面的一些知识,比如了解传统的诸如隐马尔可夫模型和高斯混合模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

引言:

根据应用场景不同,声纹识别又可以分为说话人确认(SpeakerVerification,SV)和说话人辨认(SpeakerIdentification,SI)两个任务。其中,说话人确认是指判断当前录音说话人是否是其声明的在系统中已经录入的某个说话人,是一个1:1的识别问题。而说话人辨认是指判断当前说话人具体是系统中已经录入的所有人员中的哪一个,如果系统中此前未录入此人声纹应予以拒绝。从对于输入音频的语意内容的限制上来讲,声纹识别又可以分为文本相关(Text-dependent)和文本无关(Text-independent)两个类别。前者要求所有待测音频和录入的音频在语义上具有相同的文本内容,而后者对此不加任何限定。文本无关型的声纹识别在技术上要求更高,更具挑战性,但同时在应用上更为人性化,且有更好的用户体验。所以,本文的工作也主要是围绕文本无关型的声纹识别展开。声纹识别的应用领域非常广泛,并将随着智能语音技术的发展而不断推广普及。在公共安全领域,声纹识别可以辅助破解电信诈骗等以语音数据作为破案线索的案件;在军事领域,可以通过声纹特征保障安全通讯、进行战场监听等。在金融风控领域,声纹识别可以帮助客服系统辨认接听者的身份;在移动支付领域,配合动态口令可以更加安全地进行支付身份认证。当前我国对于声纹识别技术的运用尚处于起步阶段,声纹识别在身份认证领域的市场占比依然比较小,但是具有很广阔的应用前景。随着互联网经济的日益发展和身份认证需求的不断扩大,开发和建设高准确率的声纹识别应用将会带来广泛的经济效益和社会效益。

国内外研究:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

通过阅读文献我了解到不少关于深度神经网络,以及现有声纹密码模型知识,我认为可以由以下几个步骤进行研究:

首先测试声纹识别系统性能的一个重要指标是模拟的解决方案。由于DNN-TRUST声纹识别系统的训练和识别数据是说话人声纹数据的几个帧,因此引入了信任程度,以计算说话人识别结果的分布。论文统计的概率分布,并且,当概率大于信任阈值条件时,系统确认说话人,系统识别成功,并输出识别结果。相反,系统拒绝承认说话者。

然后获取足够量的说话人语音,进行一些预处理工作,使用MATLAB对采集到的声音进行声纹特征提取,并将一热标签附加到DNN进行训练,建立声学模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

第1周:接受任务书,领会本次课题背景意义,并按要求查找相关资料;

第2周:阅读相关资料,学习理解隐马尔可夫模型等有关内容,开始学习python;

第3周:翻译相关英文资料,提出拟完成本课题的方案,写出相关开题报告一份继续学习python;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付