1.2 数字媒体应用的关键技术
1.2.1 数字视频编解码技术
数字电视与图像通信所传送的视频与音频在数字化后均有极高的数码率,例如,对图像亮度信号与色差信号分别用13.5MHz及6.75MHz的取样频率进行取样,用10位二进制数进行量化,其数码率达270Mbps。而一个频带宽为8MHz的模拟电视频道若只使用二进制调制方法只能传送不大于16Mbps的二进制数据流。因此必须想办法去除图像信号中的多余信息,将码率从270Mbps压缩到能在一个频道中传送。
研究一下电视图像信号的统计特性,就可发现在电视图像中存在着很大的相关性。去除这些相关性(即冗余度)就能实现码率压缩。能否实现高效的图像压缩编码就成了是否能实现数字电视及图像通信的关键技术之一。20世纪80年代以来,图像与声音压缩编码技术有了长足的进展。图像预测编码技术、图像变换编码技术、统计编码(包括霍夫曼编码、算术编码与行程编码)及矢量量化编码等是基本的图像压缩编码技术。
MPEG(Moving Picture Experts Group,运动图像专家组)是专门从事多媒体视频、音频压缩标准制定的国际组织,MPEG系列标准已成为国际上影响最大的多媒体技术标准,它对数字电视、视听消费电子、多媒体通信等信息产业的发展都产生了巨大而深远的影响。随着技术的进步,MPEG-2已不能适应信息时代飞速发展的要求。而新一代视频编码标准H.264(MPEG-4 AVC)具有压缩效率高、算法先进、性能优异等技术优势,目前H.264高清实时解码专用集成电路(ASIC),已经研制成功,因此可以预见在不远的将来,H.264极有可能会取代MPEG-2而成为数字电视及其存储媒体的统一编码方式。
另外,中国数字视音频编解码标准工作组制定了面向数字电视和高清晰度激光视盘播放机的AVS标准。AVS基于H.264标准,与MPEG-2完全兼容,同时又兼容H.264基本层,在许多方面具有自主知识产权,从而使专利费用大大降低。AVS压缩效率可达到MPEG-2的2~3倍,与H.264相比较,AVS的设计更加简洁,显著降低了芯片实现的复杂度,利用AVS取代MPEG-2,摆脱MPEGLA(MPEG许可证管理局)组织的专利束缚,对于中国视听产业的发展具有重要意义。
1.2.2 数字声音压缩编码技术
数字媒体应用中,声音信息的编码和传输也是极为重要的。一般电视电话和会议电视系统中,声音带宽较窄(如从300Hz至7kHz),而在数字电视系统中,高保真度的声音信号的带宽很宽,从10Hz至20kHz。利用声音信息的冗余度及人的听觉生理-心理特性,也能高效地对数字声音信息进行压缩编码。针对不同的带宽要求,国际组织制定了不同的声音压缩编码标准。
对于窄带语音信号,CCITT(ITU-TS)发布了各种基于参数及波形编码的低码率混合编码标准。如G.711、G.721、G.722、G.723、G.728及G.729等各种标准。除了G.722的取样频率为16kHz外,其他各种标准取样频率均为8kHz。而量化精度除G.711为8bit外,其他均为16bit。上述各种标准的输出码率最低为5.3kbps(G.723),最高为64kbps(G.711及G.722)。
对于宽带的高保真度声音信号,其主要标准有两个。一个是MPEG音频压缩编码标准,它是以欧洲的MUSICAM及ASPEC算法为基础而改进的一种标准。另一个是Dolby AC—3音频压缩编码标准。AC—3标准对声音信号的取样频率为48kHz,量化精度为16~24bit,其基带音频的输入多达6个声道,即中心声道、左、中、右、左环绕、右环绕及低频增强声道。AC—3已成为了DVD数字视盘及ATSC(美国数字电视标准)的声音压缩编码标准。
1.2.3 数字音视频复用、解复用技术
数字电视系统中对多媒体数据在传输中进行打包、解包处理,亦称复用、解复用技术,为系统具备可扩展性、可分级性与互操作性奠定了基础。在发送端,复用设备将视频、音频、辅助数据等信源编码器送来的数据比特流,经处理复合成单路的串行比特流,送给信道编码系统及调制系统,接收端与此正好相反。MPEG-2在系统传输层定义了两类数据流,即节目流(PS)与传输流(TS),H.264采用与MPEG-2相同的系统传输层。
在数字电视复用传输标准方面,美国、欧洲、日本均采用MPEG-2标准,其中规定HDTV数据分组长度为188字节,这正好是ATM信元的整数倍,因此可以用4个ATM信元来传送一个完整的HDTV数据包,从而可容易实现HDTV与ATM(异步转移模式)的接口,这为今后实现电信网、电视网、计算机网三网融合,构建基于ATM宽带交换及大容量光纤传输的多媒体通信网具有重要意义。
1.2.4 数字电视信道编解码技术
信道编码是实现信号可靠传输的重要保证,数字电视信道编码的目的就是通过纠错编码、网格编码、均衡等技术来提高数字电视信号的抗干扰能力。纠错编码在信道编码中占据重要地位,其本质是通过按照一定规则重新排列信号码元或加入辅助码来防止码元在传输过程中出错,并进行检错、纠错处理,以保证信号的可靠传输。纠错检错码包括线性分组码(如奇偶检验码)、循环冗余检测码、里德—索罗门(Reed-Solomon)码(外码)、交织器与去交织器、卷积编码与维特比解码、TCM格状编码调制技术等。信道编码之后的基带信号经调制实现频谱搬移之后即可送入卫星、地面、有线传输信道中进行传输。
1.2.5 数字电视调制解调技术
在数字电视系统中,采用多进制的数字调制技术可大大提高信道的频谱利用率。主要调制方式包括:
① 正交幅度调制(QAM),调制效率高,传输信噪比要求高,适用于有线电视电缆传输;
② 四相移相键控(QPSK),调制效率高,传输信噪比要求低,适用于卫星传输;
③ 残留边带(VSB)调制,抗多径传播效应好,即消除重影效果好,适用于地面开路传输;
④ 编码正交频分复用(COFDM),抗多径传播效应和同频干扰好,适用于地面开路广播和同频网广播。
1.2.6 流媒体技术
流媒体技术是一种以音视频数据流的方式在网络上传递多媒体信息的技术。与传统的多媒体下载不同,流媒体传输具有实时性和连续性的特点。边播放边下载的流式传输方式可以使用户不必等待所有的数据下载到本地即可播放。采用不同的码率传输,可以使用户在几十kbps低带宽到几十Mbps高带宽的不同网络环境中都能在线欣赏到连续不断的较高品质的音视频节目。一个基本的流媒体系统必须包括编码器(Encoder)、服务器(Server)和播放器(Player)三个模块。模块之间通过特定的协议互相通信,并按照特定格式互相交换文件数据。流媒体技术具有十分广泛的应用领域,如在线直播、网络广告、视频点播、视频会议、远程教育等。