1. 研究目的与意义
语音处理是最早采用数字信号处理技术的领域之一,本世纪50年代提出的语音形成数字模型,被广泛应用于语音编码,语音合成,语音识别,语音增强,说话人确认,语音邮件和语音存储等。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。因此研究语音信号的数字处理技术,有很大的现实意义,而实现的工程软件是MATLAB。利用MATLAB设计滤波器,可以随时对比设计要求和滤波器特性调整参数,直观简便,极大减轻了工作量,有利于滤波器设计的最优化。
本次设计声场环境中的语音识别系统是建立特定的数字语音数据库。采用MATLAB编写程序,利用计算机上的声卡,从麦克风获取语音信号,分析语音信号的特点,识别出特定的声音,并给出识别结果。利用MATLAB作为编程工具进行计算机实现,从而加深对所学知识的理解。通过系统的设计和具体的实践,可以加深自己对本学科专业知识的掌握和综合应用能力。
2. 课题关键问题和重难点
1. 本次课题需要使用软件MATLAB,在本科的课程学习中曾学习过如何使用MATLAB软件,但由于对一些操作知识已经有些遗忘,需要看视频教程再次进行学习,在学习软件的过程中要结合之前学过的知识加深记忆,严格要求自己多总结,掌握软件的功能和处理信号的要求。
2. 本次课题对语音处理的准确性要求较高。设计前对需要运用的相关函数还不熟悉,因此需要查阅文献了解相关函数,另外当设计完成后需要测试出不同声场条件下的语音识别多种数据,如何准确得出想要得到数据是设计过程的难点之一,需要熟悉软件调整参数的方法。
3. 本次课题设计需要用到数字信号处理,MATLAB课程,高等数学等学科的知识,较为综合。设计时需要多方考量。对没学过或掌握不太牢固的知识需要自己重新看书学习或者去网上查阅相关资料。课题的设计过程需要大量的理论知识支撑,在设计时掌握相关理论知识才能更好完成课题。
3. 国内外研究现状(文献综述)
语音识别是解决机器'听懂'人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。
语音作为当前通信系统中最自然的通信媒介,语音识别技术是非常重要的人机交互技术。随着计算机和语音处理技术的发展,语音识别系统的实用性将进一步提高。应用语音的自动理解和翻译,可消除人类相互交往的语言障碍,国外已有多种基于语音识别产品的应用,如声控拨号电话、语音记事本等,基于特定任务和环境的听写机也已经进入应用阶段。这预示着语音识别技术有着非常广泛的应用领域和市场前景。随着语音技术的进步和通信技术的飞速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大地便利,其应用和经济、社会效益前景非常良好。
我国的语音识别研究一直紧跟国际水平,国家也很重视。国内中科院的自动化所、声学所以及清华大学等科研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别技术研究专门立项,并取得了高水平的科研成果。我国中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其准确率和系统、均可达90%以上。
4. 研究方案
1、本设计的主要研究内容:
本课题声场环境监测和语音识别系统由软、硬件两部分组成。硬件部分的主要任务是通过麦克风和计算机上的声卡将语音信号以数字信号的形式传入计算机;软件部分的主要任务是语音信号的分析和识别。设计中运用了数字信号处理的基本原理实现对语音信号的处理,在MATLAB中综合运用信号提取,幅频变换,滤波等技术来进行语音信号处理。
2、本设计需要实现的方法及步骤是:
5. 工作计划
从大四第一学期的期末开始着手准备。在寒假期间开始进行文献翻译工作。与此同时进行MATLAB软件和数字信号处理相关知识的学习,并去网上查找相关资料和教程,观看课程并学习使用软件。收集和课题相关的资料,了解课题的研究动态。对语音识别系统进行初步设计,对所运用到函数的各项参数进行初步计算。撰写开题报告,并在截止日期之前上交。修改开题报告,对课题进行总体设计,掌握滤波器设计算法原理,录制课题需要的语音数据,确定系统的功能模块。设计完系统后开始进行测试,分析结果进行调试,修改参数至符合文献上给出的结果。并通过多次测试查看不同声场环境下的影响,通过数据说明为什么数据参数这样选取,列出相关公式跟理由。开学后完善语音识别系统和参数优化,分析结果。3月22前进行中期检查。4月26日前完成论文终稿及合格的仿真结果报告,提交材料。五月进行最终答辩。
