本条目目前处于编辑阶段,内容尚未完全完成或考证
本条目目前只有框架性概述,扩充信息尚未完成
用于对音频信号进行处理和修饰,以改变其声音特性和产生各种特殊效果的软/硬件。
信号处理的核心目标:改变音色、空间感、动态或时间维度
可分为实时处理,引入延迟的实时处理与非实时处理。
一种内部并联路由,信号在效果器内部分路,在内部分别经过不同的处理,在内部重新合并输出。
一种外部并联路由,信号通过调音台分路,输入不同的调音台通道,在局部总线或全局总线重新合并输出。
动态类效果器是针对信号动态作处理的效果器,主要工作方式是电平增益根据输入信号电平变化而变化。
动态
在数字音频信号处理中,动态是指信号在强弱、大小等方面的变化范围和变化程度。描述了信号从最小电平到最大电平之间的跨度以及在这个范围内的变化情况。
通过检测实时电平,在电平超出阈值时触发控制,对超出部分进行一定比例衰减的效果器。
(由于具有启动/释放时间,衰减量的变化为连续渐变而非瞬时跳变,这是为了尽量避免引入谐波失真)
阈值(Threshold)
使动态处理器工作的最低/最高电平大小
比率(Ratio)
电平控制比率,如输入信号电平超出阈值3db
,Ratio为2:1
,那么输出信号电平会降低1.5db
,其他情况同理
启动(Attack)
从无增益/衰减到预计的动态处理量的时间(从+-0db到-n db有一个渐变的时间)
释放(Relese)
输入信号电平大小离开触发范围后,回到+-0db的时间
衰减/增益上限(Range)
对输入信号电平最大调整幅度,不受压缩比影响。
利用光电元件来检测和控制音频信号的电平。当音频信号电平变化时,会引起光电元件的光照变化,从而改变其电阻或电流等特性,进而实现对信号的压缩处理。
响应慢,适合保留瞬态的压缩,在数字压缩中对应RMS模式。
代表性硬件型号:Teletronix LA-2A/3A、Tube-Tech CL-1B
对应软件模拟效果器:Slate Digital FG-2A、Softube Tube-Tech CL 1B、Waves CLA-2A、Overloud GEM Comp LA、NI VC-2A、bx_opto、TR5 Opto Comp 等
利用场效应管的电压控制特性,通过栅源电压来控制漏极电流,从而实现对音频信号的压缩。当输入音频信号的电平变化时,会改变场效应管的导通程度,进而改变输出信号的幅度。
响应快,适合控制瞬态,在数字压缩中对应Peak模式。
代表性硬件型号
Urei 1176、F760
对应软件模拟效果器
Arturia Comp FET-76、Overloud Gem Comp 76、Softube FET Compressor、NI VC 76、Audified U73b Compressor、Softube Drawmer 1973 等
通过控制电压放大器的增益来实现对音频信号的压缩。当输入信号电平超过一定阈值时,控制电路会降低放大器的增益,使输出信号的幅度得到限制。
如同数字压缩精准,灵活可调。
代表性硬件型号
API 2500、SSL 4000 G、Empirical Labs Distressor、Neve Master Buss Processor
对应软件模拟效果器
SSL Native Channel Strip/Bus Compressor、TR5 Comprexxor、TR5 Bus Compressor、Arturia Comp VCA-65、Overloud GEM Comp G、NI VC-160、bx_Vertigo VSC 等
利用电子管的非线性特性来实现压缩。当音频信号通过电子管时,电子管会对信号进行非线性的放大和处理,在信号电平较高时,电子管会进入饱和状态,从而限制信号的幅度,实现压缩效果。
染色重,常用于总线或Bus染色处理。
代表性硬件型号
Fairchild 670、Manley Vari-Mu
对应软件模拟效果器
Arturia Comp TUBE-STA, Overloud GEM Comp670, SPL IRON、Analog Obsession VariMoon, NI Supercharger GT, TR5 VC 670, Slate Digital FG-Mu, NI Vari Comp 等
利用二极管的单向导电性和非线性伏安特性。当音频信号通过二极管桥时,正半周和负半周的信号会被不同程度地整流和限幅,从而实现对信号的压缩。
带有独特的二极管谐波失真染色,较少见。
代表性硬件型号
Neve 33609、Neve 2264、Chandler TG12413 Zener Limiter
对应软件模拟效果器
Arturia Comp DIODE-609、Softube Chandler Limited® Zener Limiter等
先将输入的模拟音频信号变换成高频脉冲信号,振幅映射为脉冲宽度,通过高分辨率计数器,用方波的占空比来对模拟信号的电平进行编码,然后用 PWM 脉冲信号去控制音频功率放大器,通过调节占空比来实现对信号的电平调节。
失真少,精确而稳定,但由于设计难成本高而极为少见。
代表性硬件型号
Great River PWM 501、Crane Song STC-8、Pi Compressor
相比于任何模拟电路压缩器都更加精准且灵活。
代表性硬件型号
Weiss Enigineering DS1-MK3
对应软件模拟效果器
Softube Weiss DS1-MK3等
选择频段压缩 (Band-Selective Compression)
使用高通/低通/带通滤波器,以对部分频段的信号单独进行压缩的一类压缩器。
包括多段压缩器 (Multi-Pass Compressor),去齿音器 (De-Esser) 等。
去齿音器 (De-Esser)
使高频齿音中大于阈值的部分被衰减
通过检测实时电平,在电平超出阈值时触发控制,对超出部分进行一定比例增益的效果器。
(同压缩器,由于具有启动/释放时间,衰减量的变化为连续渐变而非瞬时跳变,这是为了尽量避免引入谐波失真)
向下压缩大变小,向上压缩小变大
向下扩展小更小,向上扩展大更大
通过检测实时电平,在电平低于阈值时触发控制,对低于阈值的部分进行一定比例衰减的效果器。
通过检测实时电平,适时对其进行衰减,以防止信号电平超出阈值,并尽量避免削波失真。
按照是否严格防止输出信号电平超出阈值,可大致分为两类,严格限制器(砖墙限制器)与非严格限制器。
在模拟电路中,因为信号没有严格上界,所以对严格限制没有强需求。
在数字信号处理中,超过0dB的部分的信息无法通过整值渲染、数模转换等流程,输出必然被强行削波。因此,数字信号处理对严格限制有显著需求。
严格限制器仅存在于数字音频处理流程中。
另外,由于数模转换系统的特性,经过严格限制器的数字信号转换为模拟信号后,其峰值(True Peak)可能会高于数字域中显示的峰值。
因此,按照是否防止数模转换后最终信号电平超出阈值(这无法严格防止,因为数模转换环节不可控),也可将数字限制器大致分为两类,非真峰限制器与比严格限制器更加严格的真峰限制器。
在模拟电路中,真峰非真峰的划分则缺乏意义,这个概念仅用于数模转换前的数字音频信号处理流程(尽管它指向数模转换后的模拟音频信号)。
非严格限制器。输出信号电平可能超出阈值。相较于模拟压缩器,模拟限制器呈现出更明显的不单调性特征。
尽管它的输出信号电平可能超出阈值,但这并不代表它无法限制信号电平于某一上限,这使得它与压缩器有着本质上的不同。
严格限制器。仅存在于数字音频处理流程中。由无穷大压缩比的压缩器加削波器(Clipper) 构成。
由于压缩器的非瞬时特性,严格限制的实现仍经常依赖削波器的作用。
通过引入延迟可以实现在信号超出阈值前就开始对其进行衰减,以尽量避免削波失真。
短期峰值限制器 (Short Term Peak Limiter)
检测短时窗内的最大峰值电平,并以此决定衰减量。通过引入延迟可以实现提前检测,提前衰减。
均方根限制器 (RMS Limiter)
检测短时窗内的电平均方根,并以此决定衰减量。通过引入延迟可以实现提前检测,提前衰减。
真峰限制器 (True Peak Limiter)
通过引入延迟,提前检测可能出现的True Peak,,并以此决定衰减量,且提前开始衰减,以确保经过数模转换后,模拟信号的峰值不会超过安全电平。
对音频信号的瞬态部分进行处理和塑造,以改变声音的特性和表现力的效果器。
音频信号的瞬态通常指声音开始时的快速上升部分,如鼓的敲击声、钢琴的按键音等。
瞬态处理器通过分析音频信号的瞬态特征,利用特定的算法和处理技术,对瞬态的幅度、时间等参数进行调整。
例如,它可以增强瞬态的幅度,使声音的起始部分更突出、更有冲击力;也可以缩短或延长瞬态的持续时间,改变声音的 Attack(起音)和 Release(释音)特性。
有人认为这类效果器都只是披着各种不同外衣的延迟罢了。
通过将输入的音频信号存储在内存中,并在经过一定的时间延迟后将其重新输出,与原始信号混合,从而产生回声效果的效果器。
延迟时间 Delay Time
每次返送声音被延后的时间长度
反馈 Feedback
反送的电平与上一次输入电平的比值,值通常在0到1之间,越大则湿信号衰减越慢。
对延迟时间加以时域量化随机数调制的延迟效果器。具有细碎无序的特征,常用于声音设计。
模拟声音在空间中扩散反射的效果器。
以空间反射特征分类(此分类方式不包括模拟混响,门限混响等非空间模拟类型):Ambience、Room、Studio、Chamber、Hall、Cathedral/Church、Space
以软件实现方式分类:算法混响,卷积混响。
详见混响
详见混响
由物理方式模拟空间反射声的硬件装置。
软件层面上由算法混响与卷积混响两种方式均可实现,模拟混响与这两者也并非并列关系。
板式(Plate)混响
使大型金属板由输入信号为源受迫振动,以声音在金属板内部的反射模拟声音在空间中的反射。
中高频特征明显,谐波复杂,质感独特。
弹簧(Spring)混响
使金属弹簧由输入信号为源受迫振动,以声音在弹簧两端的来回反射模拟声音在空间中的反射。
弹簧可见宏观形变。谐振频率低,共振峰较明显,质感独特。
反向(Inverse)混响
一种较短的混响类型,使用包络调制早期反射声电平,具有慢启动,快释放的特性,使听感类似倒放。
门限(Gated)混响
对湿信号加门限处理,使低于阈值的湿信号不通过,以切断混响尾音。广泛应用于鼓组。
本质是将同一个声音复制多份并赋予不同的延迟时间(通常不大于50 ms),并且利用LFO调制延迟时间,调整LFO的相位差,即可产生立体声效果。
将原始音频信号复制一份,然后将其中一个信号进行极短时间的延迟(通常在 0 - 20 毫秒之间),再将延迟后的信号与原始信号混合。
延迟时间会在一个较小的范围(通常也在 0 - 20 毫秒之间)内进行周期性的变化。
这种变化会导致两个信号之间产生相位差,从而在不同频率上产生增强或抵消的效果,形成独特的梳状滤波效应,进而产生镶边效果特有的声音。
通过将原始信号与经过多个全通滤波器处理后的信号进行混合,就会在不同频率上产生相位差,从而形成梳状滤波效应。
这种梳状滤波效应会在音频频谱上产生一系列的峰值和谷值,加以调制使之随着时间移动,即可产生出移相效果特有的 “扫频” 声音。
全通滤波器(详见下文)会改变信号的相位,但不改变其幅度。
什么是失真?
失真指的是信号在传输、处理或转换过程中,其波形、幅度、频率、相位等特征发生了改变,导致输出信号与原始输入信号之间出现差异,不能真实地还原原始信号的现象。可分为线性失真和非线性失真。
线性失真
线性失真指的是系统对输入信号的各频率分量进行了不同程度的幅度缩放和相位延迟,导致输出信号的波形发生变化,但信号的频谱结构未发生改变,即没有产生新的频率成分。例如,EQ就属于线性失真类效果器。
非线性失真
非线性失真指系统对输入信号进行处理时,由于其非线性特性,导致输出信号中产生了新的频率成分,这些新的频率成分是原始信号中所没有的,从而使信号的波形和频谱结构都发生了改变。
我们印象中的失真效果器都属于非线性失真。
直流偏移解决方法
直流耦合电容
在信号传输路径中加入直流耦合电容,通过电容的隔直特性来阻止直流成分通过,只允许交流信号通过。这种方法简单有效,常用于音频电路、射频电路等对直流偏移较为敏感的电路中。
直流偏置校正电路
采用专门的直流偏置校正电路,通过检测信号中的直流偏移量,并自动调整电路的工作点,以消除直流偏移。这种方法通常需要使用一些复杂的反馈控制电路,能够更精确地校正直流偏移,但电路结构相对复杂。
数字信号处理算法
在数字信号处理中,可以通过软件算法来去除直流偏移。例如,对采集到的数字信号进行均值计算,然后将每个采样点减去均值,即可得到去除直流偏移后的信号。这种方法灵活性高,适用于各种数字信号处理系统。
高通滤波器法
直流成分在频域上对应于零频率,属于低频信号,高通滤波器能够将其截止,从而有效去除信号中的直流偏移,只保留交流成分。这也是混音师眼中最简单的方法。
对信号进行时域量化产生的失真,在模数转换中不可避免。对应的音频参数指标是采样率(Sample Rate)。
采样率是指在单位时间内对音频信号进行采样的次数。降采样率就是减少对音频信号的采样点数。
根据奈奎斯特采样定理,为了能准确还原原始信号,采样率应至少是信号最高频率的两倍。
当降低采样率时,如果原始信号中的高频成分超过了新采样率所允许的范围,就会发生混叠现象,导致高频信号被错误地映射到低频区域,从而产生失真。
由于混叠现象,高频细节会丢失,声音可能会变得模糊、缺乏明亮度和清晰度。
例如,在一些弦乐或打击乐的高音部分,原本清脆的音色可能会变得沉闷,甚至可能出现一些额外的低频 “嗡嗡” 声,这是因为高频信号混叠到了低频区域。
对信号进行幅度重映射产生的失真。此类型包含许多市面上常见的失真类型。
音频信号的峰值超过了系统能够允许的最大幅值,为限制信号最大电平引入的谐波失真,属于塑波失真的一种。
信号的波形会在超过限幅阈值的部分被平坦化,形成类似方波的形状。
削波失真会导致音频信号的高频成分大幅增加,因为方波包含了丰富的高频谐波。
这会使音频听起来非常尖锐、刺耳,甚至可能会产生一些杂音或爆裂声,严重影响音频质量。
根据重映射曲线的拐点平滑度可分为软削波(Soft-Clipping)和硬削波(Hard-Clipping)。
对信号进行幅度量化产生的失真,在模数转换中不可避免,属于塑波失真的一种。对应的音频参数指标是比特位深(Bit Depth)。
比特位深表示每个采样点所使用的二进制位数,它决定了采样点的量化精度。
例如,16 位的位深可以表示 2^16 = 65536 个不同的量化电平。降比特位深意味着减少每个采样点能够表示的量化电平数量。
这样,原本可以精确表示的音频信号幅度值,在降低位深后可能无法被准确表示,只能被近似到有限的几个量化电平上,从而产生量化误差,形成失真。
降比特位深量化失真会影响音频信号的整体动态范围和精度。
动态范围变小,意味着信号中强音和弱音之间的差距被压缩,音频的层次感和表现力会减弱。
同时,由于量化精度降低,音频信号的细微变化无法被准确记录和还原,可能会出现颗粒感或噪声,尤其是在信号电平较低的部分,这种失真会更加明显。
对信号进行幅度折叠映射产生的失真,属于塑波失真的一种。可分为线性折叠,正弦折叠,整流折叠等。
线性折叠失真 (Linear-Fold Distortion)
对信号以某类特定方式进行幅度折叠映射产生的失真,属于折波失真的一种。
将原信号放大后,将超出阈限的部分作反向线性折叠映射,并以此类推,使信号始终保持在正负阈限区间内。
正弦折叠失真 (Sine-Fold Distortion)
对信号以某类特定方式进行幅度折叠映射产生的失真,属于折波失真的一种。
将原信号放大后,将超出阈限的部分作反向正弦曲线折叠映射,并以此类推,使信号始终保持在正负阈限区间内。
整流失真 (Rectify Distortion)
对信号以某类特定方式进行幅度折叠映射产生的失真,属于折波失真的一种。
可分为半波整流和全波整流。
半波整流会将音频信号的负半周(或正半周)削去,只保留正半周(或负半周),如一个正弦波信号经过半波整流后,负半周的波形会被置为零,只剩下正半周的波形。
全波整流则是将音频信号的负半周幅值转换为对应的正半周幅值,也就是说,无论原始信号是正还是负,经过全波整流后都变为正值。
半波整流会使信号的频谱中出现原始信号频率的奇次和偶次谐波,但直流分量会增加。
全波整流后,信号频谱中主要出现原始信号频率的偶次谐波,直流分量同样会增加。
需要注意消除整流失真带来的直流偏移。
将反转极性的输入信号削波后与原始输入信号抵消得到Delta信号,Delta信号经过可调增益与原信号混合。Delta信号增益显示为Mix,Drive则控制削波阈值及相应的增益补偿。
对信号进行波表时域重映射产生的失真。常见于波表合成器(如Serum,Vital等)内部,用于改变音频信号波形形状以产生失真效果。
可分为同步内振荡(Sync)、拉伸(Bend)、镜像(Mirror)、静态脉冲宽度调制 (Static Pulse Width Modulation)等多种子类型。
根据调制信号的变化来改变载波信号。这是一类较为复杂的失真,可以生成复杂的波形,常用于合成器音色设计。
根据调制信号的幅度变化来改变载波信号的频率。
调制信号的幅度增大时,载波频率升高;幅度减小时,载波频率降低。
频率变化的大小与调制信号的幅度成正比,变化的速率则取决于调制信号的频率。
根据调制信号的幅度变化来改变载波信号的幅度。
将调制信号与载波信号(通常频率较高)相乘,使得载波信号的振幅按照调制信号的变化规律进行改变。
当调制信号的幅值增大时,载波信号的振幅相应增大;调制信号幅值减小时,载波振幅也随之减小。
根据调制信号的幅度变化来改变载波信号的相位。较少见。
调制信号幅度为零时,载波相位不变;调制信号幅度变化时,载波相位按照一定的规律超前或滞后。
将给定频率的正弦调制信号与载波信号非线性相乘,得到的输出信号是两个输入信号频率的和频与差频成分,即输出信号的频率等于载波信号频率与调制信号频率的和以及差,而不包含原始信号的频率成分。
环形调制产生的和频与差频成分会形成一种非常独特、尖锐且带有金属感的音色,这种音色在常规的音频处理中很难获得,因此常被用于创造特殊的音效和具有实验性的音乐风格。
环形调制失真是互调失真的一类特殊情形。
根据调制信号的幅度变化来改变载波信号的脉冲宽度,改变波形的占空比。
由于音频信号的电平超过了音频设备线性工作范围上限,导致设备内部的电子元件进入非线性工作区域而产生的失真。可以按照主要电路元件大致分类。
基于电子管 (Tube/Valve) 的失真效果器
模拟电子管放大器的工作原理和失真特性。电子管在工作时会产生一种温暖、柔和的失真音色,具有独特的泛音结构和动态响应,深受很多音乐人喜爱。
电子管主要产生偶次谐波,如二次谐波、四次谐波等。偶次谐波的特点是与基波频率具有和谐的关系,能够增加声音的丰满度和温暖感,使音色更加圆润、柔和。
同时,不同类型和结构的电子管产生的谐波成分和比例也有所不同,这为塑造各种独特的音色提供了可能。
例如,一些电子管在产生二次谐波方面表现突出,会使声音具有更明显的甜味和光泽;而另一些电子管可能在高次偶次谐波的产生上更有特点,能为声音增添更多的色彩和复杂性。
但电子管效果器通常成本较高,体积较大,需要额外的电源供应,且寿命相对较短。
基于晶体管 (Transistor) 的失真效果器
利用晶体管的非线性特性来产生失真。晶体管具有成本低、稳定性好、体积小等优点,因此这类效果器较为常见。
不同类型的晶体管和电路设计可以实现不同的失真音色,从温和的过载到强烈的模糊效果都可以通过晶体管电路来实现。
基于二极管 (Diode) 的失真效果器
二极管具有单向导电性和非线性伏安特性,通过二极管的导通和截止来对音频信号进行削波,从而产生失真。
二极管失真效果器的音色特点通常较为清脆、明亮,并且具有较快的响应速度,但由于其较为剧烈的失真特性和对动态范围的限制,在声音的细节保留表现上相对较弱。
基于三极管 (Triode) 的失真效果器
利用三极管的非线性特性来产生失真。
当输入信号的幅度较大时,三极管会进入饱和区和截止区。
在饱和区,三极管的集电极电流不再随基极电流的增加而线性增加;在截止区,三极管几乎没有电流通过。
这样就导致输出信号不能按照输入信号的变化规律进行线性放大,从而使信号产生失真。
这种柔和的过载特性使得声音在失真的同时,还能保留一定的细节和动态范围,不会因为过度失真而变得模糊不清,使其音色温暖饱满。
在中低频段表现出丰富的谐波,使得乐器或人声听起来更加厚实、有质感,且高频部分的谐波提升也让声音具有一定的明亮度和清晰度,整体音色平衡度较好,适用于多种音乐风格。
通常是由于音频信号的电平超过了音频设备(如放大器、混音器等)能够处理的动态范围上限,导致设备内部的电子元件进入非线性工作区域而产生的。
例如,当输入到放大器的音频信号电压过高,超出了放大器的电源电压范围时,放大器就无法对信号进行线性放大,从而产生过载失真。
音频信号的波形会在上下两端同时发生扭曲和变形,不再是原始的正弦波或其他正常的波形形状。
过载失真通常会伴随着谐波成分的增加,这些谐波可能会改变音频的音色,使其听起来更加 “刺耳” 或 “粗糙”。
这些新增的谐波与原始信号的频率之间存在特定的数学关系,通常是基波频率的整数倍。
不同的音频设备在过载时产生的失真特性可能会有所不同,一些设备可能会产生更多的奇次谐波,而另一些设备可能会产生更多的偶次谐波。
奇次谐波会使声音听起来更加尖锐、刺耳,而偶次谐波则可能使声音变得更柔和,但也会改变原有的音色。
在模拟电路中,削波失真是指当输入信号幅值超过电路的线性工作范围时,输出信号的波形在幅值上被限制或 “削平”,不再能够真实地反映输入信号的变化,从而产生的失真。
二极管限幅电路:通常由多个二极管和电阻组成。当输入信号电压超过二极管的导通电压时,二极管导通,将输出电压限制在二极管的导通电压附近。
例如,在一个由两个二极管反向并联组成的限幅电路中,当输入信号的正向幅值超过硅二极管的导通电压约 0.7V 时,输出电压被限制在 0.7V;
当输入信号的负向幅值超过 0.7V 时,输出电压被限制在 -0.7V,这样就会使输出信号的波形在超过限幅电压的部分被急剧削平,产生硬削波失真。
稳压管限幅电路:利用稳压管在反向击穿状态下具有稳定电压的特性。将稳压管接入电路中,当输入信号电压超过稳压管的稳压值时,稳压管反向击穿,使输出电压稳定在稳压值上。
例如,一个稳压值为 5V 的稳压管限幅电路,当输入信号幅值超过 5V 时,输出信号将被限制在 5V 左右,信号的顶部或底部被迅速削平,产生硬削波失真。
利用晶体管的非线性特性:可以通过调整晶体管的偏置电压,使其工作在特性曲线的非线性区域。
当输入信号幅值逐渐增大时,晶体管的输出电流或电压不会像在线性区域那样线性增长,而是逐渐趋于饱和。
例如,在一个简单的共发射极放大电路中,适当减小基极偏置电阻,使晶体管在输入信号幅值较小时工作在线性放大区,而当输入信号幅值增大到一定程度后,晶体管逐渐进入饱和区,输出信号的幅值增长变缓,实现软削波失真。
使用对数压缩电路:对数压缩电路可以对输入信号进行对数变换,从而实现软削波效果。
常见的对数压缩电路由二极管和运算放大器组成。输入信号通过二极管的非线性特性进行对数变换,然后由运算放大器进行放大和调整。
当输入信号幅值较小时,电路近似线性放大;当输入信号幅值增大时,由于对数函数的特性,输出信号的增长速度逐渐减慢,实现了软削波失真,这种方式可以使削波后的信号在阈值附近有较为平滑的过渡。
法兹 (Fuzz)
主要利用晶体管或电子管的非线性特性,将输入信号放大到远远超出其线性工作范围,使信号产生强烈的削波失真,从而生成大量的谐波,彻底改变原始信号的波形,产生独特的模糊、厚重音色。
法兹效果失真程度很高,声音极具侵略性,有强烈的模糊感和颗粒感,谐波丰富,音色较为厚重、浑浊,甚至带有一种 “毛茸茸” 的质感,音符的延音较长,音符之间的区分度相对较低。
吉他效果器失真程度:Overdrive < Distortion < Fuzz
一些常见硬件失真的信号流程原理解析。
非线性失真/谐波失真
理想情况下,数字信号输入与模拟信号输出呈线性关系,但实际的数模转换器由于器件特性、电路设计等原因,会存在一定的非线性。
例如,当输入数字量均匀增加时,输出模拟量的增加并非完全均匀,导致输出信号不能真实地反映输入数字信号所代表的原始模拟信号,而可能会出现扭曲、变形。
在频谱上,除了原始信号的频率成分外,还会出现一些额外的谐波分量。
单调性失真
理想情况下,数模转换器的输出应该随着输入数字量的增加而单调增加或保持不变。但在实际转换过程中,可能会出现当输入数字量增加时,输出模拟量反而减小的情况,这就是单调性失真。
这种失真通常是由于 DAC 内部的电路元件特性不一致、工艺偏差等原因引起的。
在输出特性曲线上,可能出现局部的下降段,即输出模拟量与输入数字量之间的关系不再是单调递增的。
这可能导致在某些数字输入值附近,输出模拟量出现异常的跳变或不连续。
量化失真
包括降采样率量化失真和降比特位深量化失真。
由于数字信号的分辨率有限,无法精确表示所有的模拟值,只能将模拟信号量化到最接近的离散电平上,从而产生量化误差。
在信号的幅值上,量化误差会使信号出现微小的跳动或不连续。例如,对于一个缓慢变化的模拟电压信号,经过 ADC 转换后,数字输出可能会在相邻的量化电平之间跳动,而不是平滑地变化。
在信号的时域上,详见前文降采样率量化失真。
孔径失真
在数模转换过程中,从输入数字信号到输出模拟信号需要一定的时间,这个时间称为孔径时间。如果在孔径时间内输入数字信号发生变化,就会导致输出模拟信号出现失真。
特别是对于高频信号,由于信号变化较快,孔径时间引起的失真会更加明显。对于高频输入信号,输出模拟信号的边沿可能会变得模糊、不清晰,信号的上升沿和下降沿会出现延迟或变形。
在极端情况下,可能会导致信号的错误转换,使输出信号无法准确还原原始输入信号。
录音磁头是一个带有铁芯的线圈,当声电信号通过录音磁头的线圈时,线圈会产生交变磁场。
磁带是一种表面涂有磁性材料(如三氧化二铁等)的带状物体,当磁带通过录音磁头时,磁带上的磁性材料会被磁化,其磁化程度与电信号的强弱相对应,这样声音信号就以磁信号的形式记录在了磁带上。
放音磁头也是一个线圈,由于磁带的磁性材料在放音磁头附近产生变化的磁场,根据电磁感应原理,放音磁头的线圈中就会产生感应电动势,从而产生与磁带上磁信号相对应的电信号。
放音磁头产生的电信号通常很微弱,需要经过放大器进行放大,又由于磁带的磁性材料特性、磁头的非线性等因素,都会导致产生谐波失真,表现为输出信号中出现原信号频率的整数倍谐波成分。
一般来说,低频信号的谐波失真相对较小,而高频信号的谐波失真可能会较为明显。
另外,磁带机通常在低频和高频段的响应相对较弱,而在中频段相对较好。
因此,经过磁带机录制和播放后的信号,低频部分可能会显得单薄,高频部分可能会丢失一些细节。
磁带机的机械传动部分可能存在不稳定因素,如电机转速波动、磁带张力不均匀等,会导致磁带在运行过程中出现抖晃现象。
这会使录制和播放的信号在时间上产生微小的波动,表现为频率的微小变化。
磁带本身的噪声以及磁带机内部的电子噪声,会在录制和播放过程中叠加到信号上,从而引起失真。这种噪声通常表现为背景沙沙声,在信号较弱时更为明显。
唱片在制作时,声音信号通过刻纹头在旋转的唱片上刻出一条连续的、宽窄和深浅变化的音槽。
声音的不同频率和振幅会使刻纹头产生相应的振动,从而在唱片上形成不同形状的纹路。
例如,高频声音对应着较窄、较密集的纹路变化,低频声音则对应着较宽、较稀疏的纹路变化。
唱片机工作时,唱针置于唱片的音槽中。当唱片旋转时,唱针会随着音槽的纹路上下左右振动。
唱针的这种机械振动与录制时声音引起的刻纹头振动相对应,从而将唱片上的物理纹路信息转化为唱针的机械振动。
唱针连接着一个换能装置,通常是一个压电陶瓷元件或电磁感应装置。
压电陶瓷元件在受到唱针的机械压力时,会产生与压力变化成正比的电荷,从而将唱针的机械振动转化为电信号。
电磁感应装置则是通过唱针的振动带动线圈在磁场中运动,根据电磁感应原理产生感应电流,也实现了从机械振动到电信号的转换。
唱针产生的电信号非常微弱,需要经过前置放大器进行放大。
放大后的电信号再输入到功率放大器中,进一步放大功率,最后驱动扬声器发出声音。
扬声器的纸盆在电信号的驱动下做往复运动,推动空气形成声波,从而还原出唱片上记录的声音。
唱片机产生的失真与唱头、放大器等多个部件有关。
唱头在将唱片纹路的机械振动转换为电信号时,可能因自身的非线性特性产生谐波。
例如,当唱针在唱片槽中移动时,若受到的摩擦力不均匀,就会使输出信号的波形发生畸变,产生原信号频率的整数倍谐波成分。
而且不同质量的唱头,其谐波失真的程度和特性也不同,优质唱头的谐波失真相对较小,能更准确地还原声音信号。
此外,放大器部分也会对谐波失真产生影响,如果放大器的工作点设置不合理或者元件性能不佳,也会进一步放大谐波失真,导致输出声音出现明显的音色变化,如声音变得尖锐、刺耳或者过于沉闷。
唱针能否准确跟踪唱片上的螺旋形音轨是影响唱片机失真的重要因素。
唱片在制作过程中可能存在偏心、变形等问题,或者唱片机的转盘转速不稳定,都会导致唱针在跟踪音轨时出现左右摆动或上下跳动的情况。这种跟踪误差会使唱针拾取的信号不准确,产生失真。
唱片机的频率响应失真具有一定的规律性。一般来说,唱片机在低频段和高频段的响应相对较弱,而在中频段的表现相对较好。这是因为唱头的结构和工作原理决定了它对不同频率信号的转换效率不同。
在低频段,唱针的振动周期较大,容易受到唱臂的摩擦、阻尼等因素的影响,导致低频信号的衰减。
在高频段,唱针需要快速准确地跟随唱片上的微小纹路变化,而唱头的机械惯性和电气参数会限制其对高频信号的响应能力,使得高频信号的细节丢失,声音听起来缺乏明亮度和清晰度。
收音机通过天线接收来自空中的各种无线电波信号。
这些无线电波是由不同的广播电台发射出来的,它们携带着不同的音频信息,以电磁波的形式在空间中传播。天线能够感应到这些电磁波,并将其转化为微弱的电信号。
这些信号中包含了许多不同频率的电台信号,调谐电路的作用是从众多信号中选择出我们想要收听的特定电台信号。
一般收音机通过调节可变电容器或电感等元件来改变调谐电路的谐振频率,使其与目标电台的频率产生谐振。
当调谐电路的频率与某一电台的发射频率相匹配时,该电台信号在电路中产生的感应电流最强,而其他频率的信号则被抑制,这样就实现了选台的功能。
经过调谐选出的电台信号通常是高频调制信号,需要通过解调电路将其中携带的音频信号提取出来。
常见的解调方式有幅度解调(AM 解调)和频率解调(FM 解调)。
对于 AM 信号,解调电路通过检测信号的幅度变化映射为输出电平来还原出音频信号;对于 FM 信号,解调电路则是根据信号的频率变化映射为输出电平来恢复音频信号。
解调后的音频信号是一个低频电信号,但其强度仍然很微弱,需要经过前置放大器进行电压放大,将其幅度提升到一定水平,然后再经过功率放大器进行功率放大,以获得足够的功率来驱动扬声器。
功率放大器能够将音频信号的功率放大到可以使扬声器产生足够响度的声音。
由于收音机扬声器尺寸较小,低频段的声音辐射能力有限,会导致低频信号衰减,声音听起来缺乏低音效果,显得单薄;而在高频段,可能由于电路中的滤波元件或放大器的带宽限制,使得高频细节丢失,声音不够明亮清晰。
当收音机同时接收到两个或多个不同频率的强信号时,这些信号在收音机的非线性元件中相互作用,会产生互调失真。互调产物可能会落在收音机的通频带内,干扰正常的音频信号,导致声音质量下降。
例如,在收听某个电台时,可能会同时听到其他电台的微弱声音或杂音,这就是互调失真引起的干扰。这种失真在信号密集的频段,如城市中的调频广播频段,更容易发生。
收音机中的非线性元件,如晶体管、集成电路等,在信号放大过程中可能会产生谐波失真。当输入信号幅度较大时,这些元件可能会进入非线性工作区域,导致输出信号中出现原信号频率的整数倍谐波成分。
例如,收音机接收强信号时,可能会出现声音变得尖锐、刺耳的现象,这就是谐波失真导致的音色变化。此外,电源电路的不稳定也可能影响到放大器的工作状态,进而加剧谐波失真。
收音机的噪声来源较多,包括内部电路噪声和外部环境噪声。内部噪声主要由晶体管的热噪声、电阻的约翰逊噪声等引起,这些噪声会在音频信号中表现为背景杂音,影响声音的纯净度。
外部环境噪声,如附近的电器设备、电源线干扰、无线信号干扰等,也会通过收音机的天线或电路耦合进入,导致噪声失真。
特别是在信号较弱的情况下,噪声的影响会更加明显,甚至可能掩盖部分有用信号,使收听效果变差。
如果收音机的调谐不准确,没有精确地调谐到电台的中心频率上,会导致信号的部分频率成分丢失或衰减,从而产生失真。
例如,调谐偏频可能会使音频信号中的高频或低频部分被削弱,声音听起来会变得模糊、不清晰,同时还可能出现音量变小的情况。
此外,调谐不准确还可能使收音机接收到相邻频道的信号,产生串台现象,进一步影响收听效果。
当人对着电话的送话器说话时,声音引起送话器内的空气振动,进而使送话器中的振膜振动。
振膜与一个碳粒盒相连,碳粒盒内充满了碳粒,振膜的振动会挤压碳粒,使碳粒的接触电阻发生变化。
送话器两端连接着电池和电路,当碳粒电阻变化时,电路中的电流也会随之发生相应的变化。
这样,声音的振动就被转化为了相应的电信号变化,实现了声音信号到电信号的转换。
转换后的声音信号首先会被转换为数字信号进行编码、压缩和传输,在接收端再将数字信号解码并转换回模拟信号。
解码后的模拟信号通过线圈时产生磁场,这个磁场与永磁铁的磁场相互作用,使线圈产生振动,线圈与一个薄铁片(或振膜)相连,线圈的振动带动薄铁片振动,从而使周围的空气振动,产生声波。
电话系统通常会对低频声音进行衰减,以节省带宽和减少噪声干扰。这使得电话中听到的声音缺乏低音部分,听起来比较单薄,如男声的低沉嗓音会变得不那么浑厚。
同时为了防止高频噪声和干扰,电话系统也会截除较高频率的声音信号。这会导致声音的高频细节丢失,像女声的清脆嗓音会变得不那么明亮,一些辅音(如 “s”“f” 等)的发音也可能变得不清晰。
在电话信号的数字化过程中,需要对模拟信号进行量化。由于量化过程是将连续的模拟信号离散化,不可避免地会产生量化误差,这些误差表现为噪声,会使声音质量下降,听起来有轻微的沙沙声。
为了在有限的带宽下传输语音信号,电话系统采用的压缩编码算法通常会对信号进行一些近似处理,以减少数据量,这会对高频和瞬态带来较大损失。
电话线路可能会受到各种电磁干扰,如附近的电力设备、无线电信号等,这些干扰会在电话音中引入噪声。
长距离传输或线路质量不佳会导致信号衰减和畸变。
另外,电话终端的麦克风和扬声器质量会直接影响声音的采集和播放效果。质量较差的麦克风可能无法准确地采集声音信号,会使声音产生失真,如声音听起来发闷或有杂音。
同样,低质量的扬声器在播放声音时也可能无法还原出真实的音色和音量,导致声音失真。
箱头是电吉他音箱中负责信号放大和处理的部分,包含前级和后级电路。
箱头失真指的是电吉他的信号在箱头内被放大时,由于前级电路对信号进行了过度的增益或处理,导致输出的信号波形发生畸变,产生了失真效果。
当输入箱头的电吉他信号强度超过了前级电路的线性处理范围,就会引起削波现象,即信号的顶部和底部被 “削平”,从而使输出信号不再是原始信号的精确放大,而是产生了失真。
此外,箱头中的电子元件,如晶体管、电子管等的非线性特性,也会使信号在放大过程中产生新的谐波成分,进一步导致失真。
不同类型的箱头,由于采用的电路设计、电子元件以及工作方式不同,会产生各种不同风格和特点的失真效果,如经典的英式失真、美式高增益失真等。
箱体主要是指音箱中装有扬声器的部分,其作用是将箱头放大后的电信号转换为动能。
箱体失真就是在这个过程中,由于箱体本身的特性或扬声器的工作状态等原因,导致声音信号在转换和传播过程中发生了失真。
扬声器的振膜在振动过程中,如果超出了其线性工作范围,就会产生失真。例如,当输入的电信号强度过大,使振膜的振幅过大,可能会导致振膜的运动不再与输入信号成正比,从而使输出的声音信号发生畸变。
此外,扬声器的音圈在磁场中的运动也可能存在非线性,例如音圈在大电流下可能会产生过热,导致磁场强度发生变化,进而影响声音的还原度。
箱体内部的空气以及箱体本身的材料在扬声器发声时可能会发生共振。
如果箱体的设计不合理,共振频率与扬声器发出的某些频率相近,就会使这些频率的声音被过度放大或产生相位变化,从而导致失真。
同时,箱体内部还可能会形成驻波,即声波在箱体内壁之间反射,形成一些固定的波腹和波节,这也会使声音在箱体内的分布不均匀,产生失真。
如果音箱是多单元分频设计,分频器的作用是将不同频率的信号分配到相应的扬声器单元上。
但如果分频器的设计或参数选择不当,可能会导致分频点附近的频率信号分配不准确,或者在分频过程中产生相位失真等问题,进而影响整个音箱的声音表现,产生失真。
全通滤波器的传递函数在频域上的幅度响应是一个常数,这意味着它不会对信号的幅度进行衰减或放大,所有频率成分都能以相同的幅度通过滤波器。
然而,其相位响应是频率的函数,会随着频率的变化而改变,从而使不同频率的信号在通过滤波器后产生不同的相位延迟,达到改变信号相位的目的。
数字全通滤波器
递归型全通滤波器
在数字信号处理中,全通滤波器可以用递归型数字滤波器来实现。其差分方程通常具有以下形式:
其中 是输入信号, 是输出信号, 和 是滤波器的系数。通过合理设计这些系数,可以使滤波器在不同频率下具有不同的相位响应,同时保持幅度响应为常数。
这种结构在数字音频处理、通信等领域应用广泛,因为它可以方便地通过数字信号处理器(DSP)或软件来实现。
FIR 全通滤波器
利用有限脉冲响应,将输入信号延迟一定时间后,与一系列系数相乘,再将乘积相加得到输出信号。
通过精心设计滤波器系数,使滤波器在所有频率上幅度响应为常数,同时实现所需的相位特性。
例如,对于频率为 的正弦信号,经过延时时间为 的延时线后,其相位会延迟 。
当延时时间和混合比例设置适当时,就可以使所有频率的信号在幅度上保持不变,而相位按照特定的规律变化。
模拟全通滤波器
无源模拟全通滤波器
有源模拟全通滤波器
原理
包含有源元件,如运算放大器。以基于运算放大器的一阶有源全通滤波器为例,通过在运算放大器的非反相输入端设置低通滤波器,利用运算放大器的高增益和负反馈特性,实现对信号的相位调整和幅度保持。
在不同频率下,电容的容抗变化导致输入信号的相位改变,而运算放大器确保输出信号幅度与输入信号幅度相等。
特点
可以提供增益,能有效放大微弱信号,便于与其他电路级联。
通过调整有源元件的参数和电路结构,能够方便地实现各种不同的相位特性,灵活性较高,但有源元件会引入噪声,且需要稳定的电源供电,电路的复杂度和成本相对较高。
全通滤波器的应用
在音频信号处理中,可以利用全通滤波器来实现一些特殊的相位效果,如移相器就是利用多个全通滤波器对音频信号进行处理,产生独特的声音效果。
也可以用来补偿EQ,多段压缩等效果在不同频率下的相位差异,改善声音的相位一致性。
也可以用其由原信号生成相关信号,以制造立体声效果等。
Disperser及其原理
Disperser的本质就是全通滤波器组。
调整的参数是中心频率 (Frequency),共振强度 (Resonance/Pinch)和滤波器数量 (Amount)。
使低于截止频率的信号通过,高于截止频率的信号不通过。
使高于截止频率的信号通过,低于截止频率的信号不通过。
使低于截止频率的信号受衰减或增益,高于截止频率的信号不变。
使高于截止频率的信号受衰减或增益,低于截止频率的信号不变。
使截止频率附近的信号通过,其余信号不通过。
使截止频率附近的信号不通过,其余信号通过。
使截止频率附近的信号受衰减或增益,其余信号不变。
对信号进行频域塑形的效果器,是上述多种滤波器的组合。
通过特殊的全通滤波器设计,使得不同频率的信号在经过处理后,其相位变化与频率呈线性关系。
这样,信号的各个频率成分在时间上的相对位置不会发生改变,从而保持信号的原始波形和相位关系。
缺点是会引入延迟与Pre-Ring失真。
梳状滤波效应
当两个或多个相同或具有相似频率成分的音频信号相互叠加时,如果它们之间存在相位差,就会发生干涉现象。在某些频率点上,信号的相位差导致它们相互加强,形成波峰;而在另一些频率点上,信号则相互抵消,形成波谷。这种频率响应的起伏变化就像梳子的齿一样,有规律地间隔出现,因此被称为梳状滤波效应。
梳状滤波器原理
梳状滤波器的基本结构包含一个延迟单元和一个加法器(或减法器)。当输入信号进入滤波器后,一部分信号直接通过加法器(或减法器),另一部分信号则经过延迟单元延迟一段时间后再与直接通过的信号进行叠加(或相减)。
通过改变延迟时间,可以调整梳状滤波器的频率周期,从而控制滤波器的通带和阻带位置。增大延迟时间,会使频率周期变小,通带和阻带的间隔变密;减小延迟时间,则会使频率周期变大,通带和阻带的间隔变疏。
Au5超级梳状滤波器原理
与常规梳状滤波器结构有所不同,超级梳状滤波器中输入信号分为两路平行信号后,分别通过不同的延迟单元。
其中一路信号(湿延迟信号)通过延迟单元后还相继通过全通滤波器组与移频器,之后与另一路仅通过延迟单元的信号(干延迟信号)汇合。
宏控制参数包括:湿延迟时间、干延迟时间、全通滤波器数量、全通滤波器组截止频率、全通滤波器组共振强度、正/负反馈信号强度、频率升/降幅度、湿延迟信号反转极性开关。
通过改变带通滤波器的中心频率来产生独特的 “哇音” 效果。
通过分析一个声音信号(通常称为载波信号,Carrier Signal)的频谱特性,并使用另一个声音信号(通常称为调制信号,Modulating Signal)的某些特征来调制载波信号的参数,从而产生具有独特音频效果的合成声音。
通过调节左右声道信号的相对电平来实现声音的定位。
按照变化曲线分类:
线性声像定位法 (Linear Panning Law)
也被称为等功率声像定位法则。该法则下,当声音从中心位置向左右声道平移时,其音量以线性方式变化。在中心位置时,声音信号在左右声道的功率相等,随着向一侧平移,该侧声道的功率逐渐增加,而另一侧逐渐减小,且变化是均匀的。当声像完全平移到左声道或右声道时,该声道获得全部功率,而另一侧声道功率为零。
对数声像定位法 (Logarithmic Panning Law)
采用对数函数来描述声音平移时音量的变化。在这种法则中,声音在中心位置时音量适中,当向左右声道平移时,音量的变化起初相对较小,随着平移距离的增加,音量变化逐渐增大。这种变化特性使得声音在靠近中心位置时,声像的变化相对细腻,而在远离中心位置时,能够更明显地突出声音的定位效果。对数声像定位法则在一些需要营造出更具层次感和动态感的音频场景中比较常用,比如在电影音效制作中,对于一些需要在远处和近处之间快速切换位置的声音元素,使用对数声像定位法则可以让其位置变化更加自然和富有戏剧性。
按照信号路由分类:
双单声道声像定位法 (Dual Mono Panning Law)
调节过程中仅改变左右声道各自增益。在极值时,一侧声道无输出,另一侧声道输出自身单声道信号。
交叉馈送声像定位法 (Crossfeed Panning Law)
调节过程中将一侧声道电平逐渐减小的同时将这一声道输入至另一侧声道输出的电平逐渐增大。在极值时,一侧声道无输出,另一侧声道输出左右输入合并所得的单声道信号。
矢量示波器旋转 (Vectorscope Rotation)
此方法是示波器音乐制作中的重要工具。
调节过程中保持矢量示波器图像形状不变,仅发生旋转,例如,由中值点(0度角)向右侧45度角调整时,将左声道输入至右声道输出的电平逐渐增大,并将右声道输入反转极性至左声道输出的电平逐渐增大。
在右侧45度角时,左声道输出左Side输入信号,右声道输出Mid输入信号。
在右侧90度角时,左声道输出反转极性的右声道输入信号,右声道输出左声道输入信号。
在右侧135度角时,左声道输出反转极性的Mid输入信号,右声道输出左Side输入信号。
在180度角时,左右声道各自输出其反转极性的输入信号。
将立体声信号分为Mid与Side通道,对Side信号进行单独衰减或增益的效果器。
通过对Mono/Mid信号进行一系列相域频域处理 (通常是全通滤波器组)并对左右任意一侧反转极性得到的虚拟Side信号与原始信号混合得到立体声输出信号的效果器。
多种类型效果器模块的结合。
多种类型效果器模块组成的串联效果链,顺序固定。
多种类型效果器模块组成的串联效果链,顺序可调。
多种类型效果器模块组成的串并联效果链,顺序可调。
使用压缩器,通过侧链信号进行触发并决定主信号衰减量的压缩方式。
常规侧链压缩不过度避让,而是追求温和无感的处理,尽量使听众察觉不到电平有衰减。
闪避的一种实现方式。
使用压缩器,通过侧链信号进行触发,使主信号对侧链信号进行过度避让,释放时间可长达数秒,衰减量上限不会特别大。
闪避是十分常见的一类电平控制方式,现场演出中常用于音乐让人声,广电行业常用于背景声让念白,等。
抽吸的一种实现方式。
使用压缩器,通过侧链信号进行触发,使主信号对侧链信号进行过度避让,释放时间通常不超过一拍,衰减量通常不设上限。
抽吸是律动设计的一环,常见于各类电子音乐,在Melodic Dubstep中尤为明显(但电子音乐通常并不主要通过压缩方式做抽吸,而是以电平自动化为主,详见下文)。
使用自动化曲线控制电平衰减量的电平控制方式。也可实现闪避和抽吸。
通过手动编辑自动化曲线控制电平。
以LFO调制信号为自动化调制源控制电平。
例如LFO Tool、Kickstart等。
通过音频或MIDI信号触发自动化曲线控制电平,其中由音频信号触发的方式包括由主输入信号触发与由侧链输入信号触发。
可通过 Kickstart 2, ShaperBox 3 等工具实现。
(但就算是由侧链输入信号触发,这也与侧链压缩无关)
无论国内还是国外,都有许多人将抽吸冠以“侧链”之名,其中不乏大量有可观影响力的教程视频制作者(包括synthet、In The Mix等),采样包生产方(包括Cymatics、Disciple、Black Octopus Sound等),甚至VST厂商(Cableguys、Xfer等)和DAW开发商(Image-Line),给音乐制作学习社区带来了不少麻烦。
上述被批评对象被许多人视为“权威”,于是错误的认知在人们心中逐渐扎根,乃至形成某种“共识”。
严谨来说,出现“侧链”的术语必然应该和侧链信号有着不可分割的联系,例如,侧链压缩必须通过侧链信号进行触发,且必须使用压缩器,否则就不是侧链压缩了,这应该很好理解。
然而被冠以“侧链”之名的这种效果,实则与侧链完全无关。它不应该叫做“侧链”,而应该叫做抽吸。
不过,无论你持有何种观点,是否同意上述内容,这都不重要,重要的是,以上内容是否能够让你不再对这类问题感到疑惑。