1. 研究目的与意义
语言种类识别是指通过语音来自动识别说话人的过程,是根据人的声音来识别说话人的一种生物认证技术,其以独特的方便性、经济性和准确性等优势受到世人瞩目,它在现代许多领域内有良好的应用前景。
此次设计就是研究基于模糊矢量量化模型(FVQ)算法的语言种类识别的方法。
包括语音信号的采集、预处理、建模、提取特征参量,以及模型的优化,最后进行语言种类识别。
2. 课题关键问题和重难点
本课题主要是对说话人语言种类进行检测,将检测结果报告出来。
具体工作内容安排如下: 语言数据的分类及前期特征提取。
语言相关语料的收集;语言相关语料的分类;语言相关语料的标注;根据标注语料对语言语料进行语音激活检测;对语料进行预加重、分帧及加窗处理;将每一帧数据进行相关特征提取;提取每一帧的能量作为特征参数;对数据进行特征选取;对相关特征进行组合。
3. 国内外研究现状(文献综述)
模糊矢量量化采用模糊 均值聚类算法来实现矢量量化,通过隶属度函数引入不确定性思想,实现对硬聚类算法的有效扩展,在同样码本尺寸的情况下,通过模糊 均值聚类分析可以减少码本的量化误差,在实际应用中取得过较好的效果[8]。
首先定义模糊 均值聚类算法目标函数为如下(2)式所示:(2)其中 为某一观察矢量序列; 为各聚类中心组成的码本; 为一个模糊 均值隶属度函数集, 是第 个聚类中心即第 个码字的隶属度函数,它满足 ; 代表模糊度;d 表示距离。
根据目标函数的模糊 均值聚类算式如下(3)式所示:模糊 均值算法具有较好的收敛性[12]。
4. 研究方案
本课题将会研究模糊矢量量化模型在语言种类语音中的识别效果,并对这个模型进行分析,讨论其在语言种类检测中的优缺点,并以此来写文章。
对于采集的语料数据必须严格分析,特征筛选。
严谨选择模糊矢量量化参数选择,并积极对照结果进行比对。
5. 工作计划
第一周:查找文献资料,对基于模糊矢量量化(FVQ)模型算法的语言种类识别技术有个大体的了解;第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于模糊矢量量化(FVQ)模型算法的语言种类识别技术等;第三周:制定研究计划,写开题报告;第四周:学习程序语言以及编程方法;第五周:练习编程;第六周:实现参数分析方法软件部分;第七周:实现基于模糊矢量量化(FVQ)模型法的语言种类识别软件部分;第八周:实现基于模糊矢量量化(FVQ)模型算法的语言种类识别方法软件部分;第九周:实现系统软件联调的主要功能;第十周:实现软件的可视化界面;第十一周:程序修改和完善,结果分析;第十二周:写论文以及准备答辩;第十三周:写论文以及准备答辩;第十四周:验收程序,进行毕业设计答辩;
