1. 研究目的与意义
随着移动互联网的蓬勃发展和智能手机的不断普及,便捷的网络交互已成为人们日常生活中不可或缺的活动。
在网络环境下,如何能准确地确认交互方的身份成为日益重要的一个问题。
相比于传统的账号密码方案,基于人们自身具有的生物特征的身份认证机制有着更为安全可靠的优势。
2. 课题关键问题和重难点
根据设计指标要求完成学习RNN模型的建立;根据设计指标要求对样本数据进行标准化或归一化处理,即将数据按一定比例缩放,将数据映射在一个小区间内,从而去除数据的单位限制,将数据转换为无量纲数值;数据标准化后,进行系统软件调试。
与传统模型对比,通过实验结果分析此模型的优势。
在本次课题研究中鲁棒性问题是研究的难点,像用麦克风录音时会产生低频干扰噪声,而在一定信道中传送语音时也会有加性或卷积噪声产生,这些噪声都会使得得到的信号产生失真,最终降低识别率。
3. 国内外研究现状(文献综述)
声纹是对说话人语音中,具有代表性的能够标识自身的语音特征,以及在这些参数基础上建立起的语音模型的一种总称,属于一种行为特征。
而声纹识别指的是一个过程,即分析语音中的声纹特征,并以此来对这段语音对应的说话人进行识别的过程。
声纹与指纹相同,均是独一无二的,每个人声音中的语音特征以及发音习惯是不同的,无论怎样模仿,均无法改变说话人最基本的声道特点以及发音特征。
4. 研究方案
本实验设计用于语音识别,基于RNN的说话人身份识别的研究1、根据设计指标要求完成学习RNN模型的建立。
在t时刻,xi为输入向量,hi为隐藏状态向量,yi为输出向量,则表示的一个单隐藏层的RNN可定义为hi=f(Wxhxi Whhhi-1)yi=g(Whyhi)其中:Wxh是输入层与隐藏层之间的权重矩阵u;Whh是隐藏层之间的权重矩阵W;Why则是隐藏层与输出层之间的权重矩阵ν。
通常情况下,隐藏层的激活函数有 sigmoid、tanh和ReLU,而输出层的激活函数一般是线性的或者是softmax。
5. 工作计划
第1周:接受任务书,领会课题含义,按要求查找相关资料;第2周:阅读相关资料,理解有关内容;第3周:翻译相关英文资料,提出拟完成本课题的方案,写出相关开题报告一份;第4周:方案的总体设计和规划;第5周:方案各模块的设计;第6周:方案各模块的设计;第7周:各方案程序测试;第8周:软件功能验证;第9周:系统的整合;第10周:方案的测试和验证;第11周:修改、完善并提交毕业论文;第12周:评阅教师评阅论文,学生根据指导意见修改论文;验收软件成果,接受答辩资格审查;第13周:准备参加答辩;第14周:毕业设计答辩及成绩评定。
