2.2 模拟信号数字化
模拟信号数字化包括信源编码(A/D)和信源解码(D/A)两个互逆过程,是数字通信系统的必要步骤和重要特征。A/D和D/A转换可以有多种方式,本节将以国际标准的E-1数字电话通信系统为背景,重点介绍其中的脉冲编码调制(PCM)方式。
2.2.1 模/数转换
模拟信号的数字化过程包括抽样、量化和编码三个关键步骤。
抽样是指在时间上将模拟信号离散化;量化是指在幅度上将抽样信号离散化;编码则是把量化后的幅度值用二进制数值来表示。编码后的信号称为二进制数字信号,整个过程称为脉冲编码调制(PCM)。
1.抽样
图2-2示出了模拟信号的抽样效果。可以设想利用一个电子开关对输入信号f(t)的幅值进行等间隔取值,开关的通断把f(t)在时间上离散化。关于抽样,有一个著名的抽样定理:如果一个连续信号f(t)所含有的最高频率不超过fh,则当抽样频率fs≥2fh时,抽样后得到的离散信号就包含了原信号的全部信息。例如,单路语音信号频率范围大约是300~3400Hz,最高频率fh=3400Hz,按照ITU-T建议,抽样频率fs=8kHz>2fh。PAL制电视信号最高视频频率fh=6MHz,按照CCIR601建议,抽样频率fs=13.5MHz>2fh。
图2-2 模拟信号的抽样
a)输入信号 b)抽样脉冲 c)样值序列
2.量化
简单地理解,量化就是进行“舍零取整”处理。将抽样信号在某个抽样时间点的瞬时幅度值近似为最接近该点幅值的某个固定整数电平值上就完成了量化。因此,量化后的抽样值是一些幅度离散的整数值。例如,在对语音信号进行量化时,先将其幅度电平分为256级,并预先规定好每一级对应的量化幅值范围和量化值,然后比较抽样值与量化幅值范围,落在哪一级范围内,其量化值就固定在该级量化值上。为了提高量化精度,需要细分量化级数,量化级数越多,量化的准确性就越高。
量化又分为均匀量化和非均匀量化两种方式。
把信号幅值均匀地等间隔量化称为均匀量化或线性量化。若被量化信号的幅度变化范围是±U,把-U~+U均匀地等分为Δ=2U/N的N个量化间隔就是均匀量化。其中,N称为量化级数,Δ称为量化级差或量化间隔。图2-3给出了均匀量化示意图,图中量化值取每个量化级的中间值,即0.5Δ、1.5Δ、2.5Δ和3.5Δ。当抽样幅值u落在Δ<u≤2Δ时,量化为1.5Δ;当2Δ<u≤3Δ时,量化为2.5Δ,以此类推。很显然,实际抽样值u与量化值之间存在误差,这种误差称为量化误差,最大量化误差不会超过Δ/2,所以Δ越小,量化误差就越小。量化误差就好像在原始信号上叠加了一个额外噪声,称为量化噪声。量化信噪比定义为20lg(Us/Uz),其中,Us是取样信号电平,Uz是量化误差。增加量化级数N,可减小Δ,降低量化噪声。
图2-3 均匀量化示意图
在均匀量化方式中,当信号幅值比Δ大很多时,量化噪声影响不大,但当信号幅值与Δ大小接近时,量化信噪比会显著恶化。例如,当输入信号电平幅值为256Δ,量化误差为Δ/2时,量化信噪比约为54dB;而当输入信号幅值为Δ,量化误差不变时,量化信噪比仅为6dB。可见,固定不变的量化级差对于输入小信号电平的影响很大,为此需要采用非均匀量化。
非均匀量化的量化级差Δ随着信号幅值的大小而变化。当输入信号幅值较小时,量化级差Δ变小,反之则变大。这样,在不增加量化级数的前提下,允许信号在较宽泛的范围内取得符合要求的量化信噪比。
为了实现非均匀量化,在对输入信号量化之前先对其进行非线性压缩,改变大小信号之间的比例关系,让小信号做适当的放大(扩张),而大信号做适当的压缩。这样处理后得到的信号就会产生非均匀量化的效果。同时为了恢复信号的比例关系,对接收到的信号要进行相反变换。
下面以13折线A律为例,进一步解释非均匀量化的实现方法和达到的目的。
针对数字电话通信,ITU-T推荐了两种PCM编码的非均匀量化压扩标准,即A律和μ律折线标准。13折线A律如图2-4所示。x轴和y轴分别是幅值归一化后的输入信号值和输出信号值。图中仅画出了上半区的1/2内容,上、下半区各由8条由折半点相连形成的折线组成,由于靠近原点附近的1、2两段折线斜率相同(0~1/64区间),故合并为一条折线。因此,上半区共有7条折线。下半区以原点O为中心,以45°斜线为对称轴与上半区呈对称状态。上、下半区合并后共由13条折线组成。
图2-4 13折线A律示意图
当A=87.6时,下面关系式所描绘的数学曲线与图2-4所显示的图形很接近,称为13折线A律:
图2-4是把x轴以1/2n(n=1,2,…,7)递减的方式分成8个折半段,折半点分别在1/2、1/4、1/8、1/16、1/32、1/64和1/128处,然后把每段作均匀量化,分为16个量化间隔,共得到128个量化间隔。但由于各段长度不等,显然各段的量化间隔不同,最大段的一个量化间隔等于最小段的64个量化间隔,x轴左、右半区合并后共有256级量化间隔。y轴上半区也被均匀地分为8段,每段再均匀地划分为16级,共128级,y轴上、下半区合起来共有均匀量化的256级。综上可见,非均匀量化达到了把小输入信号扩张、把大输入信号压缩的目的。
表2-1列出了13折线各段斜率及量化信噪比的改善量。采用13折线A律压扩特性后,小信号量化信噪比改善量最大可达24dB,但这是靠牺牲大信号量化信噪比(损失约12dB)换来的。
表2-1 13折线各段斜率及量化信噪比的改善量
3.编码
量化后的信号幅值是一些具有离散性质的抽样值,其幅值由原来的无限多个变为有限多个。这些幅值只有经过编码后才能称为数字信号。最简单的编码方式是二进制编码,即把量化后的抽样幅值以二进制数值来表示。如果量化级数是N,则最多需要采用log2N位二进制数来表示。表2-2列出了13折线A律二进制编码值。
表2-2 13折线A律二进制编码值
在13折线A律编码方案中,输出信号的量化级数为
N=2(上、下两个半区)×8(均匀段)×16(均匀量化间隔)=256
取8位二进制数{a7a6…a1a0}来编码。a7称为极性码位,当幅值为正时,落在上半区,a7=1;否则,落在下半区,a7=0。a6a5a4称为段落码,指明幅值落在8个均匀段中的哪一个。a3a2a1a0称为段内码,指明幅值最接近段内16个量化值的哪一个。于是,在限定幅值大小范围内的任何抽样值都可由表2-2决定其所对应的13折线A律的二进制编码值。
例如,某抽样值量化后是298Δ>0,于是a7=1。因为256Δ<298Δ<512Δ,故落入第6量化段,即a6a5a4=101;又因该段起始值为256Δ,与298Δ相差42Δ,故取段内码a3a2a1a0=0011(32Δ+16Δ=48Δ)。量化误差为6Δ<8Δ(Δ6/2)。最终编码为
{a7a6…a1a0}=11010011
从表2-2可知,各段的量化间隔Δi是不同的。第1、2段量化间隔单位是Δ,每段大小是16个Δ。而最大量化间隔在第8段,该段大小是1024Δ,且每个量化间隔大小等于64Δ,充分体现出非均匀量化的特点。
2.2.2 数/模转换
数/模转换是模/数转换的反过程。接收端通过数/模转换把收到的二进制数字信号序列还原成相应幅度的模拟信号。首先按照发送端PCM编码规则把串行的PCM码按照8位一组转换为并行输出,然后区分收到的码组首位是1还是0,以确定其极性。接着判断段落码a6a5a4和段内码a3a2a1a0,由段落码得到起始电平,段内码则按位加权求和之后与起始电平相加,得到输出电平。为改善信噪比,使得数/模转换后的误差小于Δi/2,一般输出电平要固定加上或减去Δi/2量的附加电平。例如,接收298Δ的编码11010011,但实际接收到的是304Δ(含量化误差),用304Δ减去8Δ后,得到296Δ,量化误差为
298Δ-296Δ=2Δ<Δi/2
接收到的数字编码信号经数/模转换之后,就会得到包含原模拟信号的频率成分,再经过截频为fh的低频滤波器作平滑处理,滤除fh以上的无关频率,就恢复了原始信号。
2.2.3 PCM 30/32路数字电话系统
为了更深入地理解模拟信号数字传输的基本原理,下面以PCM 30/32路数字电话通信系统为例,具体说明模拟语音信号数字化传输的过程。
对于多路数字电话通信系统,国际上有两种标准化制式,即PCM 30/32路制式(E体系)和PCM 24路制式(T体系)。北美、日本等国家和地区采用的是T体系。我国和欧洲均采用E体系,表2-3列出了E体系标准的各项关键指标数据。
表2-3 PCM 30/32路数字电话系统主要参数指标
PCM 30/32路系统的基群简称E1。E1共包含32路话路时隙,其中用户可用话路时隙30个,供传送同步和控制信息的共用时隙2个,复用数据速率是2.048Mbit/s。在E1基础上更高复用数据速率采用4倍率复用方式实现。
“帧”是信道上传输的数据和控制信息串行比特流的一种格式,不同系统中,帧的长度和格式不同。图2-5是E1体系中比特流的帧结构。一帧时长规定是125μs,256bit,划分为32路等时隙,编号为TS0~TS31,每时隙3.90625μs,8bit。时隙TS0用作帧同步,时隙TS16用作信令传送,其余30个时隙分别用作话路传送。这里所说的信令是指专门用于控制系统设备动作的信号。TS16把多个用户的信令放在一起,由独立时隙传送,称为共路信令。为了便于同步控制,每16帧构成一个复帧,时长是2.0ms。
图2-5 E1体系帧结构
根据抽样定理,为了实现语音的不失真传输,抽样速率必须达到语音最高频率的2倍。通常人类语音最高频率不超过4000Hz,因此抽样速率为8000次/s。或者说为了准确无误地传送一路语音信号,每秒必须传送该路信号抽样值8000次。按照每个抽样值8bit编码,则每话路要求传输8000次/s×8bit=64000bit/s。现在每帧中包含32个话路,每话路仅占其中的8bit,所以每秒必须传送8000帧(500个复帧)才能达到要求。于是32路PCM基群传输速率是8000(帧/s)×32(时隙/s)×8(bit/时隙)=2.048Mbit/s。
图2-6示出了PCM 30/32路数字电话通信系统终端设备框图。系统的工作过程如下:用户语音信号经2-4线混合变换被送入PCM端机的发送端,经放大、低通滤波、抽样、量化、编码后形成数字语音编码。帧同步码(TS0)、信令码(复帧同步码TS16)和语音数据码在汇总电路中按PCM 30/32系统帧结构完成汇总排列,最后经码型变换将适宜于信道传输的信号码型送往线路传送。
图2-6 PCM 30/32路数字电话通信系统终端设备框图
接收过程如下:首先将接收到的数字信号进行再生整型,然后经过码型反变换,恢复成原来的码型,再由分路功能将信令码、帧同步码和数据码进行分离,分别得到各路语音码。分离出的语音码经解码、低通滤波、放大后恢复出本路的模拟语音信号,再经2-4线混合变换送至用户。其间所经过的模/数、数/模转换正是前面所描述的具体内容。
2.2.4 模拟信号数字化的其他方法
除了上述PCM脉冲编码调制技术之外,利用相邻抽样幅值相对变化的特性对抽样信号进行编码也是一种较常用的模/数转换方法。例如,差值脉冲编码(Differential Pulse Code Modulation,DPCM)、自适应差值脉冲编码(Adaptive DPCM,ADPCM)、增量调制(Delta Modulation,DM)和自适应增量调制(Adaptive DM,ADM)等。因为它们都是基于模拟信号波形抽样值进行的编码,所以又称为波形编码。在数字微波、数字卫星和光纤通信系统中,常用这些编码技术来提高信道利用率。
1.差值脉冲编码调制(DPCM)
根据模拟信号的两个相邻抽样值之间幅度差值动态变化范围较小,并具有较强相关性的特点,若仅对相邻抽样值的差值进行编码,则由于差值信号的能量远小于整个信号幅值,就可以使量化级数大大地减少,从而有利于减少编码的位数,在相同的传输速率下,可以成倍地提高信道的传输容量。
例如,对模拟语音信号按照8000Hz抽样,源信号的变化范围是±3V,若采用8位二进制数PCM编码,量化为256级,每级约23.4mV。若相邻抽样差值变化范围是±0.1V,把其化分为16个均匀量化级,每级为12.5mV,然后使用4位二进制数进行编码。编码后的数据传送速率仅需要4bit×8000Hz=32kbit/s,比采用PCM编码的64kbit/s速率降低一半,通信效率可提高一倍。
通常在模拟信号的幅值变化不是很剧烈的条件下,可以认为当前抽样幅值由两部分叠加组成。一部分与其前一个抽样幅值相关,可以通过前一个抽样幅值预测出来,更精确地说,它是由当前抽样值之前的若干个抽样值加权平均后得到的。而另外一部分是在前一个抽样值(即预测幅值)基础上变化的部分,该部分不可预测,可以看成是预测误差(简称差值)。于是,发送端只需传送差值部分的编码数据,接收端则把接收到的差值部分与本地预测值部分相加,从而得到完整的原始数据。由于差值幅度动态变化范围比整体抽样幅值小得多,因此可以在同等质量的条件下,使用较少的二进制位数来编码,等效于提高了传输效率。
我们把这种对相邻抽样值的差值进行量化、编码的过程,称为差值脉冲编码调制(DPCM)。图2-7展示了抽样值与抽样差值的关系。由图可知,抽样值S(n)(n=0,1,2,…)与其前一个抽样值S(n-1)以及差值d(n)存在如下关系:
图2-7 由抽样值得到抽样差值
a)抽样值 b)抽样差值
现在把每一个相邻抽样差值分级、量化(均匀量化或自适应量化),并进行二进制编码传输,就实现了差值脉冲编码调制。
很显然,与PCM一样,DPCM同样存在着量化误差问题。即抽样差值的量化值d′(i)与实际值d(i)总是存在着一定的误差,因此在接收端得到的当前抽样值为
式中,S′(n-1)是对S(n-1)的一个预测值。可以认为,S(n)与S′(n)的不同是由量化误差和对前抽样值S(n-1)预测不精确导致的。因此降低量化误差并提高预测精度就是改善S′(n)的一条途径。
为了降低量化误差,通常采用自适应量化取代均匀量化。自适应量化的基本思想是根据即时输入信号的大小,让量化值随时变化,当信号较小时,量化值小,反之则大。自适应量化的数学目标是让均方量化误差最小化。实践表明,在量化级数相同的情况下,自适应量化比固定均匀量化系统的性能改善10dB左右。
为了提高预测精度,可采用自适应预测取代固定预测。其基本原理是通过先前更多抽样值的线性组合来预测当前样值,提高预测信号跟踪输入信号的能力,从而提高预测精度。自适应预测的数学目标是实际值与预测值的均方差最小化。自适应预测可比固定预测提高4dB的增益。
自适应量化和自适应预测方法应用在差值脉冲编码调制上称为自适应差值脉冲编码调制(ADPCM),与DPCM相比,ADPCM扩大了前者的动态编码范围,提高了信噪比,使得系统适应性能获得改善。
2.脉冲增量调制(DM)
脉冲增量调制是模拟信号数字化的另一种基本方法。在专用通信网和卫星通信中得到广泛应用。
脉冲增量调制是把信号的当前抽样值与其前一个抽样值之差进行比较并编码,而且只对这个差值的符号进行编码,而不对差值的大小编码。具体来说,如果两个前后抽样差值为正就编为“1”码;差值为负就编为“0”码。因此数码“1”和“0”只是表示信号相对于前一时刻的增减,不代表信号的绝对值。同样,在接收端,每收到一个“1”码,译码器的输出相对于前一个时刻的值就上升一个量阶。每收到一个“0”码,就下降一个量阶。当收到连“1”码时,信号连续增长,当收到连“0”码时,信号连续下降。译码器的输出再经过低通滤波器滤去高频量化噪声,就可以恢复原信号,只要抽样频率足够高,量阶就会足够小,量化噪声也可以很小。
增量调制的过程可以用一个阶梯波去逼近一个模拟信号来表示。
一个模拟信号f(t),可以用一时间间隔为Δt,幅度差为±Δ的阶梯波形fq(t)去近似化地描述。如图2-8a所示。只要抽样间隔T足够小(见图2-8b),即抽样频率足够高,量阶Δ就会足够小,fq(t)就可以相当程度地逼近f(t)。
图2-8 增量调制波形及编码结果示意图
a)阶梯波fq(t)逼近模拟信号 b)抽样脉冲序列 c)编码后形成的数字序列 d)积分后近似波形
在时刻ti用f(ti)与fq(ti-)比较,若f(ti)>fq(ti-),就让fq(t)上升一个量阶,同时DM调制器输出二进制“1”;反之,就让fq(t)下降一个量阶,同时输出“0”。按照这种思路,得到图2-8c所示输出编码1010111111000010。
除了用阶梯波fq(t)去近似f(t)以外,也可以用锯齿波fq1(t)去近似f(t),参见图2-8a中的虚线。而锯齿波也只有斜率为正(Δ/Δt)和斜率为负(-Δ/Δt)两种情况,因此也可以用“1”码表示正斜率,“0”码表示负斜率来获得二进制编码序列。这种近似方法比阶梯波形方法更常用。
接收端译码器可由一个积分器来实现,当积分器的输入为“1”码时,就使输出上升一个量阶;收到一个“0”码时,就使输出下降一个量阶。收到连续“1”或“0”时,就会使积分器输出一直上升(或下降)。这些上升和下降量阶的累积就可以近似地恢复出阶梯波形,如图2-8d所示。
从脉冲增量调制原理可以看出,DM信号是按台阶来量化的,所以译码器输出信号与原模拟信号相比也会存在一定的量化误差。一般情况下,量化误差小于|Δ|,但当输入信号斜率陡变时,量化误差会大大超出|Δ|,这种量化误差称为过载误差或斜率过载噪声,会导致量化信噪比严重恶化。解决的方法是减小Δt或增加取样频率。