1.2 视频基础知识
无论是让人激情澎湃的视效大片,还是清新的音乐短片;无论是用计算机制作的视频作品,还是用手机编辑的短视频,我们都非常熟悉。而我们在观看视频时不一定知道这些视频是否为我们所看到的绝对动态的视频画面。要学习视频制作的方法和技巧,应该先了解我们所使用的素材的本质和制作视频的属性、结构。只有了解了这些,才能在视频编辑过程中找到合适的操作方向,避免进入误区。
1.2.1 数字视频
视频是由一系列单幅图像组成的连续画面。一幅单独的图像称为一帧,每秒在屏幕上播放若干帧,就形成了我们看到的动态画面。
为什么连续出现的图像会给我们造成这样的感觉呢?这是由于人眼在观察对象时有一种被称为“视觉暂留”(Persistence of Vision)的现象,又称“余晖效应”。人眼在观看影像时,影像在视网膜上成像,影像消失后视网膜上的影像会停留0.1~0.4秒,当有连续动作的单幅图像不断出现、消失时,我们的眼睛看到的就是连续动作的影像,如图1.3所示。这种现象很早就应用到了视觉和影像领域,“走马灯”“西洋镜”“费纳奇镜”都利用了这种现象。
图1.3 视觉暂留现象(图片来自网络,版权属于原作者)
视频一般分为两类。一类为模拟视频,由连续的模拟信号组成。模拟视频主要通过光的漫反射呈现视觉画面,通过物体的振动传播声音,我们在影院中和老式电视机上看到的视频都属于这个类型。另一类是我们研究的重点——数字视频。数字视频是以数字方式记录的视频信号,一般通过数码产品捕捉现实世界的影像(模拟信号)并将其转换为计算机能够读取和处理的电信号(数字信号);数字视频也可以由计算机程序直接制作和生成,如DV视频和数字电视。数字视频是由单幅图像组成的,而每一幅图像都由相应数量的像素组成,所以也可以认为数字视频的画面由像素组成。
提示
模数转换:将模拟信号通过模拟数字转换器(Analog to Digital Converter,ADC)转换为数字信号的过程,一般可以理解为使用摄像机、视频采集卡等设备将模拟信号转换为计算机可以处理的数字信号的过程。
1.2.2 像素及其宽高比
像素是位图的基本单位,每一个像素都是一个小方块,具有特定的位置并且记录图像中相应位置的亮度信息和色彩信息,如图1.4所示。单位面积内的像素数量越多,图像的画质也就越好,相应的文件也就越大。但是并不是所有情况下像素数量的多少都能决定画质的优劣,还要看成像装置画面中的“有效像素数”。如果图像是通过计算和像素插值方式得到的,那么图像并不能具有超过原始图像的清晰度,像素插值方式只增加了图像中的像素数量,图像的清晰度并无明显提升。
在视频的标清(Standard Definition,SD)时代,像素并非正方形,所以画面的宽高比(纵横比)为4:3时,如果像素宽高比不正确,视频画面就会被拉长或压扁。而高清时代中所有由数码产品生成的全高清数字视频的像素都是正方形的,也就是说,像素的宽高比是1:1,如图1.5所示。
图1.4 像素
图1.5 像素宽高比
1.2.3 帧速率
帧速率(Frame Rate)是指组成每秒视频的帧的数量,单位是帧/秒(fps)。较高的帧速率可以得到较高的画面流畅度,给人较好的视觉感受。但超过60帧/秒后,人眼对流畅度的变化不再敏感;如果低于10帧/秒,视频在视觉上就会出现比较严重的卡顿。不同的电视制式适用不同的帧速率,我国采用的电视制式为PAL,其帧速率是25帧/秒,如图1.6所示,详细内容可参考“1.2.6电视制式”。
图1.6 常用视频标准
1.2.4 帧大小
帧大小(Frame Size)是指组成视频的单幅画面的尺寸,即画面水平和垂直方向上的像素数,数量越多,画面的清晰度越高,帧大小的基本单位是像素(px)。一般可以通过“水平像素数×垂直像素数”来表示,如标准为720P的视频尺寸可表达为1280 px×720 px,也就是画面的水平方向上有1280像素,而画面的垂直方向上有720像素。宽高比是指视频图像的宽度和高度的比例,传统的标清视频的宽高比是4:3;高清视频的宽高比是16:9,即宽屏画面,这种画面更符合人眼的结构和观察习惯。
1.2.5 扫描方式
扫描方式分为“隔行扫描”和“逐行扫描”两种。隔行扫描主要用于制作DV标清视频或电视台播出的视频,画面内物体运动过快或场类型选择错误会导致其边缘有较明显的锯齿感。
逐行扫描是指显示屏对显示图像进行扫描时,从屏幕左上角的第一行开始逐行进行扫描,整幅图像一次扫描完成。这样得到的画面闪烁小,质量高。现在的液晶显示器大都采用逐行扫描方式,如图1.7所示。
隔行扫描是一种非逐行的扫描方式,在成像时每幅画面都被分割成若干个水平线条,按照排列顺序给线条编号为1,2,3,4,5,6,7,8,9,10,…,n,将画面一分为二,由编号为奇数的行组成的一半画面称为“奇数场”(上场),由编号为偶数的行组合成另一半画面称为“偶数场”(下场),两者组成一幅完整的画面。隔行扫描又分为两种情况:第一种是先扫描奇数场,后扫描偶数场,再将扫描到的图像拼合成一幅画面,称为奇数场优先或上场优先;第二种是先扫描偶数场,后扫描奇数场,再将扫描到的图像拼合成一幅画面,称为偶数场优先或下场优先。
图1.7 逐行扫描和隔行扫描
1.2.6 电视制式
我们制作的视频需要符合电视台的播出标准才能在电视机上播放,世界上各个国家和地区的电视视频标准不尽相同,这种标准就是我们所说的电视制式。世界上广泛使用的电视制式主要有PAL、NTSC、SECAM这3种,各种电视制式的区别主要体现在分辨率、帧速率和扫描方式上。
1.PAL制式(1967年)
PAL(Phase Alteration Line),又称帕尔制,意为逐行倒相扫描。PAL制式主要应用于中国、朝鲜和德国等国家和地区。根据不同的参数,PAL制式又可以进一步划分为G、I、D等制式,其中我国采用的是PAL-D制式。
●帧速率:每秒25帧。
●扫描方式:隔行扫描,奇数场(上场)优先。
●标准分辨率:720px×576px。
●画面宽高比:4:3。
2.NTSC制式(1952年)
NTSC(National Television Standards Committee),N制,意为(美国)国家电视标准委员会。NTSC制式主要应用于美国、加拿大、日本、韩国等国家和地区。
●帧速率:每秒29.97帧。
●扫描方式:隔行扫描,偶数场(下场)优先。
●标准分辨率:(标清)720 px×480 px。
●画面宽高比:4:3。
3.SECAM制式(1966年)
SECAM(法语:Séquentiel couleur à mémoire),塞康制,意为“按顺序传送彩色与存储”。SECAM制式主要应用于法国、俄罗斯、东欧和中东等国家和地区,这种制式的参数与PAL制式类似。
●帧速率:每秒25帧。
●扫描方式:隔行扫描,奇数场(上场)优先。
●标准分辨率:720 px×576 px。
●画面宽高比:4:3。
随着时代的发展,高清晰度电视(High Definition Television,HDTV)已经逐渐替代了传统的标准清晰度电视(Standard Definition Television,SDTV),随之而来的就是高清视频的应用和普及。HDTV源于数字电视(Digital Television,DTV)技术,采用数字信号,具有较好的视频、音频效果。HDTV有以下3种显示格式。
①1280 px×720 px,非交错式(逐行扫描),场频为60Hz。
②1920 px×1080 px,交错式(隔行扫描),场频为60Hz或50Hz。
③1920 px×1080 px,非交错式(逐行扫描),场频为24Hz、25Hz或30Hz。
根据GY/T 155——2000《高清晰度电视节目制作及交换用视频参数值》的规定,我国高清晰度电视制作和播出采用隔行扫描1920 px×1080 px/50i格式,但也可以用1920 px×1080 px/25P格式拍摄或制作,再转换为1920 px×1080 px/50i播放。
1.2.7 比特率
比特率是指每秒传输的比特(bit)数,可理解为视频生成过程中所使用的数据容量,单位是kbit/s(千比特)或Mbit/s(兆比特)。比特率主要表示经过编码(压缩)后的音、视频数据每秒需要用多少比特来表示。比特率越高,音、视频的质量就越好,但编码后的文件也就越大。
比特率编码模式有以下两种。
可变比特率(Variable Bit Rate,VBR):没有固定的比特率,压缩软件在压缩过程中,根据视频数据使用或高或低的比特率,如编码光影变化复杂或运动剧烈的画面时会加大数据容量,而编码相对静止或简单的画面时将会减小数据容量。无论哪种画面,VBR模式都以质量为前提并兼顾文件大小,因此该模式是推荐编码模式。设置比特率时,“目标比特率”直接决定数据容量大小,而“最大比特率”是数据速率的最高界限。
固定比特率(Constant Bit Rate,CBR):压缩文件时自始至终都采用一种比特率。相对于VBR模式,在CBR模式下压缩得到的文件更大,而且画面质量不会有明显提高。
1.2.8 视频的压缩与解压缩
视频的压缩与解压缩实际上就是编码、解码的过程。视频压缩是使用硬件或软件将未经压缩的原始数据进行编码的过程,而视频的解压缩过程与视频压缩的过程相反,即把编码后的数据还原为原始数据。摄像机录制视频,软件采集、转码视频或生成视频等属于压缩的过程,而DVD机播放光盘、播放器软件播放视频等属于解压缩的过程。数据压缩方法也可以理解为编码方法。
我们在录制和生成视频的过程中,要根据客户要求、硬件、传播载体和网络带宽等对数字信号进行适当压缩,这样做可以精简视频数据中的冗余信息,如相似的像素、相邻帧、色彩深度、分辨率、帧率、码率等,以便在特定情况下更好地进行视频的传播。
数据压缩的方式较多,不同特点的数据要选择不同的数据压缩(编码)方法,本书主要涉及无损压缩和有损压缩两种方法。无损压缩是指对数据中的冗余信息进行压缩,所以无损压缩的压缩比一般比较小。这类方法主要应用于特殊应用场合的图像数据等需要精确存储的数据的压缩,而有损压缩利用了人类视觉、听觉对图像、声音中的某些频率成分不敏感的特性,允许数据在压缩过程中损失一定的信息。有损压缩广泛应用于语音、图像和视频数据的压缩,是我们研究的重点。
1.2.9 视频编码标准
视频编码标准主要有动态图像专家组(Moving Picture Experts Group,MPEG)与H.26x两大系列(见图1.8),以及音视频编码标准(Audio Video Coding Standard,AVS)系列和AV1(Alliance for Open Media Video 1)系列,压缩视频时应选择具有兼容性和高效性的编码标准。
图1.8 视频编码标准(MPEG与H.26x系列)
1.MPEG系列
MPEG是国际标准化组织(International Origanization for Standardization,ISO)与国际电工委员会(International Electrotechnical Commission,IEC)于1988年成立的专门针对运动图像和语音压缩制定国际标准的组织。MPEG标准包括MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21等。
2.H.26x系列
这个标准是国际电信联盟(International Telecommunications Union,ITU)下属的视频编码专家组(Video Code Experts Group,VCEG)制定的标准,主要应用于实时视频通信领域。VCEG制定的标准包括H.261、H.262、H.263、H.264和H.265等。
H.264/AVC,也就是MPEG-4 Part 10,是由来自ISO、IEC和ITU的成员共同组成的联合视频专家组(Joint Video Team,JVT)确立的标准。其良好的编码质量和较快的编码速度使得该标准受到许多平台的支持,至今依然是高清视频经常使用的编码标准。2013年推出的H.265/高能效视频编码(High Efficiency Video Coding,HEVC)具有惊人的压缩比和超高画质,但因为专利收费问题,其应用始终没有得到普及。
2020年推出的H.266/多功能视频编码(Versatile Video Coding,VVC)有望成为未来的主流标准。H.266/VVC是由德国弗劳恩霍夫通信技术研究所(Fraunhofer HHI)和苹果、爱立信、英特尔、华为等公司在2020年联手推出的新一代视频编码标准,相比于视频编码标准H.265/HEVC,该标准大幅提高了文件的压缩比。在相同画质的条件下,采用H.266/VVC标准压缩的视频文件只有H.265/HEVC标准的一半大小。H.266/VVC主要应用于4K、8K超高清晰度视频及3D、全景等多维度视频,可以进一步改善用户的视觉体验。
3.AVS系列
AVS是“信息技术先进音视频编码”系列标准的简称,是我国具备自主知识产权的音视频编码标准。AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,具有先进性、自主知识产权和开放化三大特点,为数字音视频产业提供全面的解决方案。
该系列标准有AVS+、AVS2和AVS3共3个。2012年,国家广播电影电视总局正式颁布了GY/T 257.1——2012《广播电视先进音视频编解码 第1部分:视频》行业标准,简称AVS+。2018年推出的AVS2编码标准在某些方面有显著的优势。2019年推出的AVS3编码标准是我国拥有自主知识产权的第三代音视频编解码技术标准,2021年春晚就采用AVS3编码标准,实现了全球首次8K超高清试播。
4.AV1
AV1视频编码标准是由AOM(Alliance for Open Media,开放媒体联盟)制定和开发的第一代视频编码标准。其特点是开放、免版权费。AOM的主要成员包括亚马逊、思科、谷歌、英特尔、微软、Netflix、NVDIA、爱奇艺、腾讯、阿里巴巴及三星等公司。
AV1是类似于VP9的免费、开源的视频编解码标准,相较于H.265/HEVC,在保证相同的分辨率和画质的条件下,使用AV1标准压缩的视频的文件量可以降低20%左右。
1.2.10 常用视频/音频格式
视频是由若干幅静态图像组成的,直接捕捉的画面的原始数据容量极大且使用困难,而且我们在播放和使用的过程中受到播放介质和网络条件等诸多限制,无法得到最佳的使用体验。所以一些国际组织和公司制定了相应的编码格式和封装格式,以保证视频使用的便捷性和规范性。
编码格式属于内容部分,是一个视频文件的核心,它负责使用特定的压缩技术将视频或音频信号源编码成一种数据文件。这种文件是决定音、视频的种类和品质的关键。而封装格式属于包装部分,是大家常见的音、视频格式,它将编码后的音频、视频等数据封装起来,封装格式在一个音频、视频文件中起到容器的作用,它解决了数据同步和回放的问题。容器无法决定数据的品质,却有自己的特点,如有的封装格式可以支持多个视频或音频,有的支持外挂字幕,有的则具有流媒体功能。
1.常用编码格式
(1)H.264/AVC
H.264/AVC是在MPEG-4技术基础上建立起来的,其编码后的文件格式是常用的MP4格式。其优点是码率低、质量高、网络适应能力强,是常见的流媒体文件格式,也是目前主流的HD视频的首选编码格式。
(2)H.265/HEVC
H.265/HEVC是在H.264的基础上制定的新的视频编码标准,其编码后的文件格式是常用的MP4格式。在码率降低50%的情况下,H.265可以提供与H.264相同的画质,但高昂的专利费用和复杂的授权政策导致多年来该编码格式的普及率并不高。
(3)QuickTime
QuickTime是苹果公司提供的一个完整的多媒体架构,支持macOS和Windows平台,其编码后的文件格式是常用的MOV格式。其具有H.264、Animation(动画)、Apple ProRes 422(HQ)、Apple ProRes 4444(XQ)等先进的视频编码技术,是流媒体代表格式之一。
(4)DNxHD/HR MXF OP1a
数字非线性可扩展高清(Digital Nonlinear Extensible High Definition,DNxHD)编码后的文件格式是常用的MXF格式,这是一种开放的媒体文件格式,能够实现Avid系统与第三方MXF产品间的数据交换。其特点是能在反复修改的情况下保证画面质量,在macOS与Windows平台中都有较好的兼容性。
(5)MPEG2
MPEG的设计目标是高级工业标准的图像质量及更高的传输率,其编码后的文件格式是我们常用的MPG格式。MPEG2是较为落后的编码格式,压缩率不高,编码后的文件大,多用于DVD影碟的制作,而影碟中的视频使用的格式是VOB格式,可以使用Premiere Pro CC进行编辑。
(6)MXF OP1a
素材交换格式(Material eXchange Format,MXF)是我们常用的一种文件格式,是美国电影与电视工程师协会(SMPTE)定义的一种专业音视频媒体文件格式,主要应用于影视行业的媒体制作、编辑、发行和存储等环节。而MXF OP1a主要用于广播电视行业的视频制作,该编码格式更常用于索尼公司的产品。
其中,有以下两种常用编码格式:一种是XDCAM,另一种是较新的XAVC。
XDCAM为索尼公司在2003年推出的无录影带式专业录影系统,其中常用的有XDCAM HD和XDCAM EX两种。XAVC格式是索尼公司在2013年推出的视频编码格式,其中常用的有XAVC QFHD和XAVC HD两种。XAVC格式支持FULL HD、2K和4K分辨率,具有可变速拍摄、码率和画质适中等特点。
(7)Windows Media Video
Windows Media Video是微软公司开发的一组数字视频编解码格式,它是Windows Media架构的一部分。最初它是作为低速率流媒体应用专有编解码格式开发出来的,微软公司基于Windows Media Video开发了几个视频编解码规范并且提交给SMPTE申请作为标准,其中包括Windows Media Video 7、Windows Media Video 8、Windows Media Video 9和用于移动端的Windows Media Video 10。相对来说,Windows Media Video 9是微软公司研究的重点,它不仅是编码格式,还是一个平台。在保存一些AVI格式的文件时,常将其转换为WMV格式,虽然这样做会降低视频质量,但可以将视频数据容量减小为原来的几分之一,对于视频存档来说画质够用了。
(8)P2影片
P2影片是松下公司推出的编码格式,使用的是DVCPRO和AVC-Intra这两种由松下公司开发的广播级方案,其符合H.264/MPEG-4AVC编码标准,编码后的文件格式是MXF格式。AVC-Intra较新,可以看作DVCPRO的升级。
2.常用视频封装格式
视频封装格式也就是我们平时所说的视频格式,视频的封装格式种类繁多,有的适用于不同的操作系统,有些适用于不同的生产厂商,还有的则适用于不同的时期。通常,根据视频投放平台或客户的要求进行选择即可。
(1)AVI格式
AVI格式(扩展名为.avi):它的英文全称为Audio Video Interleaved,即音频视频交错格式。该视频格式由微软公司于1992年推出,AVI格式算是Windows操作系统中最基本的,也是最常用的一种媒体文件格式。
这种视频格式的优点是图像质量好,无损的AVI格式经常被我们用来保存Alpha通道的视频和数据。它的缺点有很多,其原始架构过于陈旧,这使得它在支持新的音视频编码标准上非常困难,而且编码后的文件容量过于庞大,更加糟糕的是由于编码标准不统一、编码混乱且编码标准相对较旧,没有更新换代,所以高版本和低版本Windows媒体播放器不兼容。
在标清时代下,DV-AVI格式使用得非常多。DV(Digital Video)是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。数码摄像机就是使用这种格式记录视频数据的。它可以通过计算机的IEEE 1394接口将视频数据传输到计算机中,也可以将计算机中编辑好的视频数据回录到数码摄像机中。一盒60分钟的Mini DV带的视频数据容量约为13GB。
常见的视频编码有Cinepak Codec by Radius(画质较差、渲染时间较长)、Microsoft Video R 3.2(画质较差)、Microsoft RLE、Intel Indeo Video 4/5.10(画质好、渲染时间适中)、Intel IYUV Codec和None(无损压缩)(画质非常清晰、但文件容量大)。想要画面和质量性价比较高,可以选择康能普视的Canopus HQ AVI或Canopus None AVI。这两种编码是康能普视自主研发的,需要安装康能普视解码器才可以播放编码后的视频。如果需要通用性较强,可以选择DV、DVCPRO HD、DVCPRO或者无损压缩。
(2)MOV格式
MOV格式(扩展名为.mov)即电影数字视频技术(Movie Digital Video Technology),是苹果公司开发的一种音、视频文件封装格式,用于存储常用的数字音频和视频的媒体信息。MOV格式是非常常用的一种视频格式,其兼容性较好,支持包括macOS和Windows在内的操作系统,同时也是常用的流媒体视频格式。
MOV格式的图像质量高,视频编码种类丰富,不但可以存储高质量的视频文件,还支持流式视频的传输,其所使用的播放器是QuickTime Player。但是从macOS Mojave 10.14开始macOS彻底不支持32位应用,其中包括QuickTime Player。其部分功能被其他软件所替代。相应地,Premiere Pro CC 2018年4月版(版本12.1)、After Effects CC 2018年4月版(版本15.1)、Adobe Media Encoder 2018年4月版(版本12.1)、Adobe Audition CC 2018年4月版(版本11.1.0)也不支持QuickTime Player 7系列的格式和编码器。虽然新的系统不支持旧版软件和编码器,但是其他几个常用的可在QuickTime电影文件中找到的专业编解码器,如Apple ProRes、DNxHD和Animation(动画,支持Alpha通道)不会受此次更改的影响。
MOV格式使用率非常高的原因还在于一些专业的中间编码格式的支持,如Apple ProRes。统一的编码可以有效提高后期制作效率,而且MOV格式的视频即使经过多次转码,质量损失也极小,特别是在macOS平台中。常用的编码包括Apple ProRes 4444 XQ、Apple ProRes 4444(含Alpha通道)、Apple ProRes 422 HQ、Apple ProRes 422(10位深)、Apple ProRes 422 LT(适合作为素材存储格式使用)、Apple ProRes 422 Proxy(适合作为代理剪辑使用)、Apple ProRes RAW。
(3)MPEG/DAT/VOB格式
MPEG格式是动态图像压缩算法的国际标准。目前,MPEG格式有4个关于视频的压缩标准,分别是MPEG-1、MPEG-2、MPEG-4和MPEG-5。MPEG-1被广泛应用于VCD,而MPEG-2则用于HDTV和DVD,MPEG-1、MPEG-2目前使用较少,使用较多的是MPEG-4,它是为了播放流媒体的高质量视频而专门设计的。
DAT格式并不是一种标准文件,许多文件都使用这种格式,但不同的文件,其含义也不同,扩展名.dat的意思是data,即数据文件。VCD中的DAT文件可以用一般的视频播放器打开。如果想直接编辑DAT文件,可以将扩展名.dat改成.mpg。DVD中的VOB文件也可以用一般的视频播放器打开,它是DVD视频介质的数字视频、音频和字幕的一种容器格式,而且也可以直接将扩展名.vob改成.mpg,原因就是DAT文件和VOB文件都是用MPEG压缩标准压制的。
(4)WMV格式
WMV(Windows Media Video)格式是微软公司开发的一系列视频编解码和与其相关的视频编码格式的统称,其兼容性较差,是Windows媒体框架的一部分。WMV格式的文件可以边下载边播放,因此很适合在网上播放和传输,WMV格式是流媒体视频的常用格式。
(5)MP4与M4V格式
MP4是一套用于音、视频的编码标准,主要用于在网上播放和传输的多媒体视频、视频电话及数字视频。MP4格式使用的压缩标准是MPEG-4压缩标准的第10部分,也就是H.264。
MP4本身不符合流媒体视频的具体要求,MP4依赖索引表,而且一开始就要固定好索引表,如果索引表在尾部,MP4文件就会无法解析。但是可以通过实时流传输协议(Real Time Streaming Protocol,RTSP)实现视频文件的在线播放。
M4V(MPEG-4的第14部分)是一个标准的视频文件格式,由苹果公司推出。此格式为iPod、iPhone所使用,同时此格式基于MPEG-4编码第二版。其视频编码采用H.264或H.264/AVC,音频编码采用高级音频编码(Advanced Audio Coding,AAC)。H.264高清编码,相比于传统的H.263、Divx等,能够以更小体积的文件实现更高的清晰度。M4V格式也称为苹果公司的视频播客Podcast格式,是MP4的特殊类型。
(6)MTS格式
MTS格式的扩展名为.mts,是一种较新的高清视频格式,主要用于入门专业级高清摄像机。索尼高清数码摄像机NEX-VG900E录制的视频就是这种格式,其视频编码通常采用H.264,音频编码采用AC-3,分辨率为全高清标准分辨率或1440 px×1080 px。其中,1920 px×1080 px分辨率下的MTS达到全高清标准,意味着视频的画质很高。因此,MTS是迎接高清时代的产物。这种格式常见于当前一部分索尼高清硬盘摄像机或其他品牌摄像机录制的视频中,通过索尼或其他品牌高清硬盘摄像机录制的视频,未经采集时,在软件和摄像机上显示的扩展名为.mts。
(7)FLV格式
FLV(Flash Video)格式是由Flash MX延伸出来的一种网络视频封装格式,在优酷下载的视频可以自动转码为这个格式。FLV格式的视频文件容量特别小、加载速度也极快。随着视频网站的增多,这个格式已经非常普及。除了FLV格式CPU占有率低、视频质量良好、文件体积小等适合网络发展特点外,丰富、多样的资源也是FLV格式成为统一的在线播放视频格式的一个重要因素。
(8)Matroska和MKV格式
Matroska多媒体容器(Multimedia Container)是一种开放标准的自由容器和文件格式,也是一种多媒体封装格式,能够在一个文件中容纳无限数量的视频、音频、图片或字幕轨道。
Matroska与AVI、MP4等其他容器格式类似,但其在技术规程上完全开放,可将多种不同编码的视频及16条以上不同格式的音频和不同语言的字幕流封装到一个MKV媒体文件中。MKV是为这些音频、视频提供外壳的“组合”和“封装”格式,换句话说就是一种容器格式。
视频编辑软件对MKV格式的支持不是特别好,很少有专业的非线性编辑软件可以用来直接编辑MKV格式的文件,但是要想分割、提取、转换、合成和编辑MKV格式的文件则可使用MKVToolNix。MKVToolNix是目前功能比较齐全的Matroska合成器。
(9)RMVB和RM格式
RMVB是RealNetworks公司开发的RealMedia多媒体数字容器格式的可变比特率(VBR)扩展版本。相对于更常见的按CBR编码的流媒体RealMedia容器格式,RMVB多应用于保存在本地的多媒体内容。使用该格式的文件的扩展名是.rmvb。RMVB是一种视频文件格式,其中的VB是指可变比特率(Variable Bit Rate)。其画面较上一代RM格式清晰很多,原因是降低了静态画面的比特率。由于其压缩比非常高,画质已经没有压缩的空间,因此几乎没有剪辑软件可以用来直接编辑这种格式的文件。
3.常用音频封装格式
音频封装格式也就是我们平时所说的音频格式,音频的封装格式种类繁多,下面介绍一些常用的音频封装格式。
(1)MP3格式
MP3(MPEG-1 Audio Layer 3)是一种音频压缩技术,其中文名称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),其编码后的文件格式是我们常用的MP3格式。MP3是当今较流行的一种数字音频编码和有损压缩格式,它被设计用来大幅度地降低音频的数据容量,而对大多数用户来说压缩后的音质与最初的未压缩音频相比没有明显下降。
MP3是一种有损压缩格式,其提供了较高的数据压缩比,压缩特点是忽略音频数据中对人类听觉影响不明显的高频声音信号数据,从而大幅减小文件数据容量,音质通过选择的音频比特率来决定,如128kbit/s、192kbit/s、256kbit/s和320kbit/s。MP3是互联网中最常见的音频信号记录格式,有非常好的兼容性,适合在有网络带宽限制的环境中传播。
(2)WAV格式
WAV是最早的数字音频格式之一,是流行的声音文件格式之一,由微软公司开发,被Windows平台及其应用程序广泛支持。该格式能记录各种单声道的声音或立体声,也是无损压缩的格式之一,但其文件容量很大。其在Windows系统中的兼容性非常好,新版的macOS也支持WAV格式的导入和导出。
WAV格式支持许多压缩算法,以及多种量化位数、采样频率和声道,采用44.1kHz的采样频率和16位量化位数的音频的音质与CD相差无几,但WAV格式对存储空间的需求太大,不便于传播。
(3)AAC格式
AAC是一种专为声音数据设计的文件压缩格式。AAC是1997年推出的基于MPEG-2的音频编码技术,由Fraunhofer IIS、杜比实验室、AT&T公司、索尼公司等共同开发,目的是取代MP3格式。2000年,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC,重新集成后的格式又称为MPEG-4 AAC。
AAC的音频算法在压缩率上远超以前的一些音频算法(如MP3)。它能同时支持48个音轨、15个低频音轨、多种采样率和比特率、多种语言、更高的解码效率。相较于MP3,AAC格式的音质更佳,文件容量更小。AAC可以在比MP3文件容量小30%的前提下提供更好的音质,是比较好的有损压缩格式,但其音质还是无法与目前比较流行的APE、FLAC等无损压缩格式相比。
(4)AIFF格式
音频交换文件格式(Audio Interchange File Format,AIFF)是苹果公司开发的一种声音文件格式,被macOS平台及其应用程序所兼容。AIFF多应用于个人计算机及其他电子音频设备以存储音乐数据,支持16位44.1kHz立体声等。
(5)OGG格式
OGG(OGGVorbis)是一种新的音频压缩格式,类似于MP3等格式,它也是有损压缩格式,但将相同位速率(Bit Rate)编码的OGG与MP3相比,OGG的音质更好。OGG是完全免费、没有专利限制的。OGG文件的扩展名是.ogg,支持多声道。
(6)WMA格式
视窗媒体音频(Windows Media Audio,WMA),一般使用.wma为扩展名,是一种有损压缩格式。它是微软公司推出的与MP3格式齐名的音频格式。
WMA在压缩比和音质方面都超过了MP3,远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。WMA格式以减少数据流量但保持音质的方法来达到更高的压缩比,其压缩比一般可以达到1:18,生成的文件大小只有相应的MP3文件的一半左右。
(7)FLAC格式
无损音频压缩编码(Free Lossless Audio Codec,FLAC)是一种著名的自由音频压缩编码,其特点是无损压缩,编解码速度快,使用广泛且开源。不同于如MP3和AAC等其他有损压缩编码格式,它不会破坏任何原有的音频信息。
无损压缩格式有很多,而国内非常流行的无损压缩格式是APE和FLAC。音频以FLAC格式压缩时不会丢失任何信息。相对于APE格式,FLAC格式的文件容量较大,但是其兼容性好,编码速度快,支持的播放器更多,免费且支持大多数操作系统。
(8)APE格式
APE是Monkey’s Audio提供的数字音乐无损压缩格式,在我国有着庞大的用户群。APE这类无损压缩格式以更精练的记录方式来减小文件容量,还原后的数据与源文件一样,从而保证了文件的完整性。很多时候它被用来进行网络音频文件的传输,因为压缩后的APE文件要比WAV源文件小1/2,甚至更小,可以有效缩短传输时间。
APE是目前非常流行的数字音乐文件格式,是著名的无损压缩格式,在国内被广泛应用。它的压缩比非常大,而且效率高、速度快。APE格式受到了许多音乐爱好者的喜爱,特别是对希望通过网络传输音频CD的用户来说,APE格式可以帮助他们节省大量资源。但相比于FLAC格式,APE格式的编码速度比较慢。
1.2.11 流媒体
流媒体(Streaming Media)是指将一连串的媒体数据压缩后,以流的方式在网络中分段发送数据,实现在网络上实时传输影音文件以供观赏的一种技术与过程。
传统的视频文件需将整个视频文件的数据全部下载到系统里后才能观看,而流媒体会先下载一部分数据文件到缓存区,在播放过程中再下载剩余数据。
只有一些特殊格式的文件才适合作为流媒体文件,如FLV、RMVB、MOV、RMVB、ASF等格式,要实现其他容器格式的文件的在线播放,必须通过流媒体服务器来完成编码和传输,因此流媒体服务器是流媒体应用系统的重要组成部分。
流媒体的3个特点分别是连续性、实时性和时序性。它能够连续、实时传输数据,用户不必等到整个文件下载完毕即可观看。流媒体文件启动延时短且只需要较小的缓存容量。