基于i-vector的说话人识别研究开题报告

 2022-11-24 08:11

1. 研究目的与意义

语言沟通是人类社会中最常见、最自然的交流方式,语音中包含着说话人、语义、情感等各种有价值的信息,其中说话人信息作为可识别的生物特征之一有着重要的身份认证价值。

本课题研究的主要内容是将说话人信息作为识别特征,区分出不同说话人身份,即说话人识别,该项研究属于生物识别技术的研宄领域。

生物识别技术通过对人的生理或者行为特征实现身份识别。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

本课题关键问题是如何实现说话人识别。

即根据一句话,判断出该语音数据来自说话人集合中某个说话人。

课题具体的内容分为:说话人识别的分类情况、识别原理以及结构、特征提取工作;语音信号的产生机制、预处理操作、时域和频域分析等;说话人识别涉及的基本技术及经典算法;基于i-vector说话人识别;系统实现和实验结果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

最早的说话人识别研究可以追溯到半个世纪前,很多科研工作者在二战时期己经开始研究说话人识别技术。

1962年,Lawrence Kersta在《自然》杂志上发表了文章:基于语谱图的说话人识别方法[1],文章中总结了人体发声器官的功能,提出将语谱图作为关键生物特征完成说话人识别的思想,Lawrence Kersta的研究成果,表明机器识别出说话人是存在可能性的。

此后一直到80年代的二十年间,说话人识别研究步入系统化。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

根据识别对象的不同来分类,说话人识别主要包含两类:与文本无关、与文本有关。

与文本有关的识别对象需要以发音的关键词和关键句子为训练文本,识别时要求按同样的内容发音,文本内容固定,识别难度小,但现实生活中应用受限,数据不容易获取。

与文本无关 的识别对象,识别的不是固定内容,而是自由的语音信号,应用灵活,但识别难度大。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

五、工作计划第1周:接收任务书,领会课题含义,按要求查找相关资料;第2周:阅读相关资料,理解有关内容;第3周:翻译相关英文资料,提出拟完成本课题的方案,写出相关开题报告一份;第4周:参阅有关资料;第5周:完成方案设计,掌握相关编程技能;第6周:了解设计平台的使用方法;第7周:方案实现,设计框图、流程图的绘制;第8周:根据实现结果,对方案进行调整与修改;第9周:各个模块单独测试;第10周:系统调试;整理资料,准备撰写论文;第11周:修改、完善并提交毕业论文; 第12周:评阅教师评阅论文,学生根据指导意见修改论文;验收实物成果,接受答辩资格审查;第13周:准备参加答辩第14周:毕业设计答辩及成绩评定。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版