1. 研究目的与意义
说话人识别,就是根据采集的声音信号,来鉴定说话人身份的一种生物识别技术。
近年来,对于说话人识别应用,人们一直将高斯混合模型作为主要方法。
通过不断研究,都使用以GMM为基础的 GMM-UBM 框架,努力提高说话人识别系统的性能,并成功应用到说话人验证系统中。
2. 课题关键问题和重难点
本次课题实验受声门激发和口鼻辐射的影响,会形成高频率的语音信号,难以解决。
难以采集到清楚的声音信号,并且每次采集的声音信号不可能会一致,这使得实验结果具有不确定性,难以比较。
DNN虽然具有高准确性但计算成本巨大,调节参数十分复杂。
3. 国内外研究现状(文献综述)
当今社会,数字化时代随之来临,大量的信息和数据充斥了生产和生活的各个角落,然而技术进步的同时,许多风险和安全问题也逐渐产生。
首要是解决关于个人身份确认方面的问题,典型的几种认证方式,钥匙、密码、各种身份证件等所要求的技术水平层次较低、容易实现,但是也很容易丢失、泄露及破解,造成身份信息被冒用等状况。
因此,生物识别技术应运而生,生物识别技术通过对个体独特的特征进行识别,实现对个人身份的认证。
4. 研究方案
本实验设计用于语音识别,基于DNN的I-vector的声学特征提取研究1.根据设计指标要求完成学习DNN模型的建立,将i-vector的维数设成与GMM超向量一样的维数,以得到更好的性能2.建立GMM-UBM模型 GMM-UBM 声纹识别系统3. 进行系统软件调试,进行系统软件调试,把原有的i-vector模型中的UBM替换为基于音素状态的DNN模型 本文算法总体框图4.进行数据计算,得出每一帧的实验概率进行比对
5. 工作计划
第1周:接受任务书,领会课题含义,按要求查找相关资料;第2周:阅读相关资料,理解有关内容;第3周:翻译相关英文资料,提出拟完成本课题的方案,写出相关开题报告一份;第4周:方案的总体设计和规划;第5周:方案各模块的设计;第6周:方案各模块的设计;第7周:各方案程序测试;第8周:软件功能验证;第9周:系统的整合;第10周:方案的测试和验证;第11周:修改、完善并提交毕业论文;第12周:评阅教师评阅论文,学生根据指导意见修改论文;验收软件成果,接受答辩资格审查;第13周:准备参加答辩;第14周:毕业设计答辩及成绩评定。
