freeBuf
主站

分类

漏洞 工具 极客 Web安全 系统安全 网络安全 无线安全 设备/客户端安全 数据安全 安全管理 企业安全 工控安全

特色

头条 人物志 活动 视频 观点 招聘 报告 资讯 区块链安全 标准与合规 容器安全 公开课

点我创作

试试在FreeBuf发布您的第一篇文章 让安全圈留下您的足迹
我知道了

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

Voice Sec从入门到放弃
r2ate1 2022-12-17 15:48:51 31960
所属地 河北省

语音编码理论基础

信号分类及转换:

由模拟信号(自变量和函数值均为连续)经过采样转换为时域离散信号(自变量离散,函数值连续),再经过量化转化为数字信号(自变量和函数值均为离散)。


why DFT

任意连续周期信号都可表示正弦信号的加权和     ——Fourier

首先是对于复杂信号而言,时域难以分析,于是换一个角度,引入了频域;同时呢,频率也能很好的反应信号变化的快慢。那么怎样才能将信号从时域域转为频域呢,毫不犹豫——Fourier Transform。

读者不必去深究其数学原理,只需掌握采样定理(延拓法和折叠法)、DFT的手工计算、采样率和物理频率的对应关系以及分辨率和点数的对应关系。

时域分析

要求考生能够对信号系统的因果性、稳定性、线性和时不变性进行分析,并且能够熟练应用采样定理。

频域分析

主要是掌握3大变换:傅立叶变换 离散傅立叶变换 Z变换;

数字滤波器

低通 高通 带通 和 带阻

分类可以分为:无限长单位脉冲响应和有限长单位脉冲响应;


语音的声学基础:


产生:激励(声门脉冲) 系统(声道) 响应(声音)

基音周期/频率 :反应声源信息,决定音高;共振峰:反应声道信息,决定音色;

线性模型:激励 声道 和 辐射模型

语音的感知:响度:声音的强弱 音调 :声音的高低 掩蔽效应:强音导致弱音不容易被听到,又分为时域掩蔽(掩蔽音和被掩蔽音不在同一时刻)和频域掩蔽(一个音调可以将其附近频域较弱的音调掩蔽);


语音特征分析:

预处理:预加重,分帧,加窗;

短时平均能量:反应声音能量随时间的变化,可用于检测清音浊音 有声无声等,

短时平均幅度:能量对幅度敏感,放大了高低信号的差距

短时平均过零率:每帧内信号通过零值的次数,可以粗略反映信号的频率,判断的方法类似于零点定理;

浊音能量集中在低频,过零率低;清音能量分布比较均匀,过零率高;

相关反应信号的相似程度,自相关反应信号的周期性;自相关函数的性质:周期性,偶函数;

浊音自相关具有相同周期,可以估算基音周期和基音频率;清音接近随机噪声,自相关没有周期性和明显峰值;

卷积的步骤:翻转 移位 乘累加,与自相关的区别是自相关无需移位。

倒谱:将卷积转化为相加:傅立叶变换:卷积变乘——>取对数(乘变加)——傅立叶逆变换(线性变换,频谱的频谱)。卷积的倒谱等于各信号倒谱之和,倒谱的应用主要为:解卷积,实现激励与声道的分离。

Why语音编码:

无线通信频谱资源日益短缺,用户及业务需求日益增长,大数据背景下信息存储压力大,

手段:针对语音的信源编码,减少传输码率,提高传输效率;

分类:波形编码,参数编码,混合编码;

评价指标:编码速率 语音质量 稳健性 时延 复杂度


语音安全实战分析

有点类似于CTF中的摩斯电码,

先录一段语音,简单分析之后对其进行加密:

1670204508_638d4c5ce543448018578.png!small?1670204511165


  1. clear all;  
    clc;  
    [x,fs]=audioread('xxxxx:\xxx\xxx.wav');  
    x=x(:,1);%双声道分列处理  
    x=x(20000:20000*5-1)   
    x=ceil(x*10000)%全部变为整数  
    n=length(x);  
    key1=123456789  
    key2=1234  
    x=x+key2;  
    for i=1:n  
    y(i)=bitxor(x(i),key1,'int32');  
    end  
    x=x-key2;  
    x1=x/10000;  
    sound(x1,fs);%播放原音频  
    pause(4);  
    y2=y-key2;  
    y1=y2/10000;  
    sound(y1,fs);%播放加密音频  
    for i=1:n  
        z(i)=bitxor(y(i),key1,'int32');  
    end  
    pause(4);  
    z2=z-key2;  
    z1=z2/10000;  
    sound(z1,fs);%播放解密音频  
    audiowrite('xxxxxx:\xxxxx\xxxxx.wav',z1,fs)  



加密后的信号:

1670205162_638d4eea7022c6518425f.png!small?1670205164331


解密后恢复正常。

# 网络安全
本文为 r2ate1 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)
被以下专辑收录,发现更多精彩内容
+ 收入我的专辑
+ 加入我的收藏
网安的冬天
r2ate1 LV.4
网安文学,
  • 15 文章数
  • 4 关注者
物理安全和可靠性
2022-12-19
OS丛话(计算篇)
2022-12-18
OS丛话(算法篇)
2022-12-18
文章目录