1.1.3 数字媒体的关键技术
数字媒体技术是一门多学科的综合技术,涉及许多相关技术,简介如下。
1.数据压缩技术
数据压缩技术包括算法和实现视频及音频压缩的国际标准、专用芯片和其他硬件与软件等。数据压缩技术的发展,使得实时传输大容量的图像、音频和视频数据成为可能。一幅640×480像素分辨率的彩色图像,数据量约为7.37Mbit/帧以上。例如,(640×480)像素×3基色/像素×8bit/基色=7.3728Mbit),如果是视频(运动图像),要以每秒30帧的速度播放,则视频信号的传输速度为221.2Mbit/s,存放于650MB光盘中只能播出23s。对于音频信号,若达到电话声音质量,每秒采样数据8bit/样本;若达到高保真(Hi-Fi)立体声(如CD唱盘),则每秒采样数据44.1KB,若量化为16bit两通道立体声,则650MB光盘只能存放1h的数据(44.1kHz×16bit/样本×2声道=1.4Mbit/s),其传输速率为1.4Mbit/s。多媒体数字信号因其不仅数据量大而需要较大的,而且要求存储空间大和传输速度快,因此,视频、音频信号的数据压缩与解压缩技术是多媒体的关键技术。压缩与解压缩技术的关键是图像信息的压缩,特别是视频图像信息的压缩。
压缩可分为两种类型:一种是不失真的压缩,一种是失真的压缩。不失真的压缩固然受到欢迎,但其研究应用难度较大。根据“特征选取”学说,一种好的特征选取方法有可能比一般的数据压缩方法更加适用。失真的压缩技术正是基于这一认识,以丢弃一部分信息为代价,保留最主要的最本质的信息。
数据的压缩可以看成是一种变换,数据的解压缩则被认为是一种反变换,这种变换的方法,又称为编码技术。数据编码技术大致经历了两个发展阶段:1977—1984年为基础理论研究阶段;1985—1995年为实用化阶段。目前最流行的关于压缩编码的国际标准有彩色静止图像的压缩方式JPEG、彩色运动图像的压缩方式MPEG及电视电话/会议电视编码方式H.261。
(1)JPEG标准:JPEG标准主要适用于压缩静止的彩色和单色多灰度的图像,一般用于彩色打印机、灰度和彩色扫描仪、部分型号的传真机。JPEG标准分为基本压缩系统、扩展系统(在基本系统上增加了算术编码、渐进构造等特性)和分层的渐进方法(通过滤波建立了一个分辨率逐渐降低的图像序列)3个系统。JPEG标准采用了混合编码方法。其基础是离散余弦变换(DCT)和霍夫曼变换,这是一种失真的有损压缩算法,即图像质量和压缩比有关,压缩比越大,图像质量损失越多。由于JPEG算法中要进行大量计算,因此需要配备专用的快速JPEG信号处理器,以减轻计算机CPU的负担。
(2)MPEG标准:MPEG英文原意为“运动图像专家小组”。由于ISO/IEC11172压缩编程标准是由该运动图像专家小组于1990年制定的,因此将该标准称为MPEG标准。该标准又分为3个,其中MPEG-1用于普通电视,MPEG-2用于数字电视,MPEG-4为多媒体应用标准。MPEG标准具体包含MPEG视频、MPEG音频和MPEG系统(视频与音频同步)3部分。
MPEG视频是标准的核心部分。它采用帧内和帧间相结合的压缩方法,以离散余弦变换(DCT)和运动补偿两项技术为基础,最终获得了100∶1的数据压缩率(MPEG-1)。
MPEG音频压缩算法则根据人耳的屏蔽滤波功能,利用“某些频率的音响在重放其他频率的音频时便听不到”这样一个特性,将人耳完全或基本上听不到的音频信号压缩,使音频信号的压缩比达到8∶1或更多,同时音质逼真,可以与CD唱片媲美。
按照MPEG标准,MPEG数据流包含系统层和压缩层数据。系统层含有定时信号、图像和声音的同步信息、多路分配等信息,压缩层包含经压缩后的实际的图像和声音数据,该数据流传输速率为1.5Mbit/s(MPEG-1)。
在实用化阶段,压缩技术在很多方面有了新的进展;1989年,工程师们制出了第一块具有压缩技术的大规模集成电路芯片。
2.数据媒体存储技术
数据媒体存储技术包括多媒体数据库技术和海量数据存储技术。多媒体数据库的特点是数据类型复杂、信息量大,光盘、U盘、移动硬盘和云存储技术的发展,大大带动了多媒体数据库技术及大容量数据存储技术的进步。此外,数据媒体中的声音和视频图像都是与时间有关的信息,在很多场合都要求实时处理(压缩、传输、解压缩);同时,多媒体数据的查询、编辑、显示和演播,都向多媒体数据库技术提出了更高的要求。
3.专用芯片技术
大规模集成电路的发展,使得多媒体计算机的运算速度和内存容量大幅度提高。
多媒体计算机专用芯片一般分为两种类型:一种是具有固定功能的芯片;一种是可编程的处理器。具有固定功能的芯片,主要用于图像数据的压缩处理,主要的半导体厂商有C-cube等公司。可编程的处理器不仅需要快速/实时地完成视频和音频信息的压缩和解压缩,还要完成图像的特技效果(如淡入淡出、马赛克、改变比例等)、图像处理(图形的生成和绘制)、音频信息处理(滤波和抑制噪声)等项功能。目前,主要生产厂商有Intel公司等。
4.输入/输出技术
多媒体输入/输出技术涉及各种媒体外设以及相关的接口技术,包括媒体转换技术、识别技术、媒体理解技术和综合技术。
(1)媒体转换技术:是指改变媒体的表现形式,如当前广泛使用的视频卡、音频卡都属于媒体转换设备。
(2)媒体识别技术:是对信息进行一对一的映像过程。例如,语音识别是将语音映像为一串字、词或句子;触摸屏是根据触摸屏上的位置识别其操作要求。
(3)媒体理解技术:是对信息进行更进一步的分析处理和理解信息内容,如自然语言理解、图像理解、模式识别等。
(4)媒体综合技术:是把低维信息表示映像成高维模式空间的过程,例如语音合成器就可以把语音的内部表示综合为声音输出。
5.云计算和云存储技术
云计算(Cloud Computing)是分布式计算技术的一种,它的基本概念是通过互联网将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器组成的庞大系统通过搜寻、分析计算之后将处理结果返回给用户。透过这项技术,网络服务提供者可以在数秒之内处理数以千万计以上的信息,达到和超级计算机相同效能的服务。
最简单的云计算技术在网络服务中已经随处可见,例如搜寻引擎、网络信箱等,使用者只要输入简单的指令,就可以获得大量信息。未来的手机、GPS等设备都可以通过云计算技术来发展出更多的应用服务。
云存储是在云计算概念上的延伸和发展来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和访问功能的一个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。
6.网络和移动通信技术
(1)网络技术:因特网(Internet)是一个通过网络设备把世界各国的计算机相互连接在一起的计算机网络,人们将其看成是信息高速公路的起点。人们可以通过连入因特网,尽情享用其提供的服务和信息资源。因特网上已经开发了很多应用,归纳起来可分成两类:一类是以文本为主的数据通信,包括文件传输、电子邮件、远程登录、网络新闻和电子商务等;另一类是以图像、声音和电视为主的通信,通常把上述两类内容称为多媒体网络技术。
万维网(WWW)亦称Web,是在因特网上运行的全球性分布式信息系统。它的主要特点是将因特网上的现有资源全部通过超链接互连起来,用户能够在因特网上查找到已经建立的WWW服务器的一切站点提供的超文本、超媒体资源文档,这些文档中包括文本、图像、声音、动画、视频等数据类型。
(2)移动通信技术:移动通信是移动体之间或移动体与固定体之间的通信,通信双方有一方或两方处于运动中的通信,移动体可以是人,也可以是汽车、火车、轮船等在移动状态中的物体。采用的频段遍及低频、中频、高频、甚高频和特高频。目前的移动通信已经发展到第三代移动通信系统(3G)和第四代移动通信系统(4G)。第三代移动通信系统最基本的特征是智能信号处理技术,支持话音和多媒体数据通信,它可以提供前两代产品不能提供的各种宽带信息业务,如高速数据、慢速图像与电视图像等。第四代移动通信系统是最新的移动通信系统,它集3G与WLAN于一体,能够传输高质量视频图像,图像的质量与高清晰度电视不相上下;该系统能够以100Mbit/s的速度下载,比拨号上网快2000倍,上传的速度也能达到20Mbit/s,并几乎能满足所有用户对于无线服务的要求。