r2ate1
- 关注
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9

语音编码理论基础
信号分类及转换:
由模拟信号(自变量和函数值均为连续)经过采样转换为时域离散信号(自变量离散,函数值连续),再经过量化转化为数字信号(自变量和函数值均为离散)。
why DFT
任意连续周期信号都可表示为正弦信号的加权和 ——Fourier
首先是对于复杂信号而言,时域难以分析,于是换一个角度,引入了频域;同时呢,频率也能很好的反应信号变化的快慢。那么怎样才能将信号从时域域转为频域呢,毫不犹豫——Fourier Transform。
读者不必去深究其数学原理,只需掌握采样定理(延拓法和折叠法)、DFT的手工计算、采样率和物理频率的对应关系以及分辨率和点数的对应关系。
时域分析
要求考生能够对信号系统的因果性、稳定性、线性和时不变性进行分析,并且能够熟练应用采样定理。
频域分析
主要是掌握3大变换:傅立叶变换 离散傅立叶变换 Z变换;
数字滤波器
低通 高通 带通 和 带阻
分类可以分为:无限长单位脉冲响应和有限长单位脉冲响应;
语音的声学基础:
产生:激励(声门脉冲) 系统(声道) 响应(声音)
基音周期/频率 :反应声源信息,决定音高;共振峰:反应声道信息,决定音色;
线性模型:激励 声道 和 辐射模型
语音的感知:响度:声音的强弱 音调 :声音的高低 掩蔽效应:强音导致弱音不容易被听到,又分为时域掩蔽(掩蔽音和被掩蔽音不在同一时刻)和频域掩蔽(一个音调可以将其附近频域较弱的音调掩蔽);
语音特征分析:
预处理:预加重,分帧,加窗;
短时平均能量:反应声音能量随时间的变化,可用于检测清音浊音 有声无声等,
短时平均幅度:能量对幅度敏感,放大了高低信号的差距
短时平均过零率:每帧内信号通过零值的次数,可以粗略反映信号的频率,判断的方法类似于零点定理;
浊音能量集中在低频,过零率低;清音能量分布比较均匀,过零率高;
相关反应信号的相似程度,自相关反应信号的周期性;自相关函数的性质:周期性,偶函数;
浊音自相关具有相同周期,可以估算基音周期和基音频率;清音接近随机噪声,自相关没有周期性和明显峰值;
卷积的步骤:翻转 移位 乘累加,与自相关的区别是自相关无需移位。
倒谱:将卷积转化为相加:傅立叶变换:卷积变乘——>取对数(乘变加)——傅立叶逆变换(线性变换,频谱的频谱)。卷积的倒谱等于各信号倒谱之和,倒谱的应用主要为:解卷积,实现激励与声道的分离。
Why语音编码:
无线通信频谱资源日益短缺,用户及业务需求日益增长,大数据背景下信息存储压力大,
手段:针对语音的信源编码,减少传输码率,提高传输效率;
分类:波形编码,参数编码,混合编码;
评价指标:编码速率 语音质量 稳健性 时延 复杂度
语音安全实战分析
有点类似于CTF中的摩斯电码,
先录一段语音,简单分析之后对其进行加密:
clear all; clc; [x,fs]=audioread('xxxxx:\xxx\xxx.wav'); x=x(:,1);%双声道分列处理 x=x(20000:20000*5-1) x=ceil(x*10000)%全部变为整数 n=length(x); key1=123456789 key2=1234 x=x+key2; for i=1:n y(i)=bitxor(x(i),key1,'int32'); end x=x-key2; x1=x/10000; sound(x1,fs);%播放原音频 pause(4); y2=y-key2; y1=y2/10000; sound(y1,fs);%播放加密音频 for i=1:n z(i)=bitxor(y(i),key1,'int32'); end pause(4); z2=z-key2; z1=z2/10000; sound(z1,fs);%播放解密音频 audiowrite('xxxxxx:\xxxxx\xxxxx.wav',z1,fs)
加密后的信号:
解密后恢复正常。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)
