视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
语音信号的时域特征与频域特征
2025-09-25 02:55:48 责编:小OO
文档
实  验  报  告

课程名称  ____________语音信号处理__________________     

        实验项目    语音信号的时域特征与频域特征   

实验仪器 __台式计算机、Matlab软件、Cool Edit__

        系    别____信息与通信工程学院_____

        专    业_____电子信息工程专业______

班级/学号_____

学生姓名 ___________________   

        实验日期 _______2013/4/17________

        成    绩 _________________________

            指导教师 _____________________

实验一:语音信号的时域特征与频域特征

一、实验目的

使学生通过本实验观察语音信号在时域和频域的基本特征(语音波形、基音频率、过零数、共振峰),验证教材中关于语音信号在时域和频域的基本特征的概念与论述;通过采集语音数据与在实验中记录每个元音的基音周期、过零数、共振峰等环节熟悉这些语音的基本特征,为今后深入学习语音信号处理奠定基础。

二、实验内容

学习音频编辑软件Cool Edit的使用方法及语音文件的建立;采集语音数据;观察语音波形;记录每个元音的基音周期(其倒数为基音频率)、过零数、共振峰;观察语音频域特征;分析不同元音的共振峰模式的特点(频率、相对振幅)。

三、实验原理

元音与辅音在发音方法有如下基本区别:发元音时气流顺利通过声腔,声带颤动,形成的声波是周期性的;发辅音时气流暂时被阻不能通过或只能勉强挤出去。

元音具有基音与共振峰结构,辅音则不具有这两者。

基音由声带振动频率产生,决定语音的音高、音调。在语音波形中表现为准周期峰值。

共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。

四、实验方法与实验步骤

(一)音频编辑软件Cool Edit的使用方法及语音文件的建立

 点击桌面上“cool edit”图标,选不同项可激活cool edit菜单中不同功能。

  点击“file”菜单中的“new”,设抽样频率为8KHz,单声道“mono”,“8 bit”。

 点击“Record”录音,将录音存成“.wav”文件。

 ④点击菜单中“View”中的“Spectral View”可观看语谱图。

 ⑤点击菜单中“Analyze”中的“Frequence Analysis”可分析频谱。

 ⑥点击菜单中“Effects”中的“Amplitude”可改变幅度。

(二)观察语音时域特征

    在E盘或D盘建立实验者本人的文件夹,然后做以下实验。

发【a】、【i】、【e】、【u】这四个元音,由麦克风采集语音数据,分别存成“a.wav”、“i.wav”、“e.wav”、“u.wav”文件,存在本人的文件夹中。

利用Cool Edit打开并观察以上语音数据的波形。

③元音波形中的准周期结构与声带振动频率对应,其周期称为“基音周期”(其倒数为基音频率),利用Cool Edit观察元音的波形,记录每个元音的前部、中部和后部的各一个基音周期。

④记录每个元音的任意一个基音周期中的过零数。

⑤ 共振峰是语音频谱的峰状区域,利用Cool Edit观察上述每个元音的频谱,记录每个元音的前三个共振峰的数值。

   波形截图:

图(1)元音a前部

图(2)元音a中部

图(3)元音a后部

图(4)元音i前部

图(5)元音i中部

图(6)元音i后部

图(7)元音e前部

图(8)元音e中部

图(9)元音e后部

图(10)元音u前部

图(11)元音u中部

图(12)元音u后部

图(15)元音e的共振峰频率分析图

图(13)元音a的共 振峰频率分析图

图(14)元音i的共 振峰频率分析图

图(16)元音u的共振峰频率分析图

  (三)观察语音频域特征

对你发的【a】、【i】、【e】、【u】这四个元音中每一个元音,分别选取稳定段的256个抽样,利用 Matlab 的 FFT计算其频谱,并利用subplot命令以波形和频谱对应的形式画出图形。部分参考程序如下

y = wavread('e.wav');

t=1:length(y);

y2 = wavread('e.wav',[4000 4512]);

y2F=fft(y2);

subplot(3,1,1)

plot(t,y,'-b',4000,[0.2:0.005:0.4],'-r',4512,[0.2:0.005:0.4],'-r')

subplot(3,1,2),plot(y2);grid on

subplot(3,1,3), plot(log(abs(y2F)));grid on

Matlab程序结果截图

图(17)元音a的时域波形和频域波形

图(20)元音u的时域波形和频域波形

图(19)元音e的时域波形和频域波形

图(18)元音i的时域波形和频域波形

表1   实验数据记录表

基音频率过零率共振峰(dB)

0Hz148Hz290Hz
a66535513-41.91-50.36-50.14
i50525314-42.07-52.74-53.13
e49525316-43.42-52.03-53.23
u56576010-45.74-51.-52.61
五、思考题

(1)共振峰与语音波形有什么相关之处?

答:共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰不但是音质的决定因素,而且反映了声道(共振腔)的物理特征。 在语音声学中,共振峰决定着元音的音质,而在计算机音乐中,它们是决定音色和音质的重要参数。 共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。因此,不同的语音波形有不同的与之对应的共振峰模式。

 (2)基音周期与音调的高低有什么对应关系?

答:基音由声带振动频率产生,决定语音的音高、音调。因此,音调的高低决定了基因频率,从而决定了基因周期大小。

六、实验收获

    下载本文

显示全文
专题