1.1 数字视频基础知识
1.数字视频的基本概念
数字视频(Digital Video):包括运动图像(Visual)和伴音(Audio)两部分。
一般说来,视频包括可视的图像和可听的声音,然而由于伴音处于辅助地位,并且在技术上视像和伴音是同步合成在一起的,因此具体讨论时有时把视频(Video)与视像(Visual)等同,而声音或伴音则总是用Audio表示。所以,在用到“视频”这个概念时,它是否包含伴音要视具体情况而定。
2.数字视频信号
(1)标清:物理分辨率在720p 以下的一种视频格式,简称 SD。720p 是指视频的垂直分辨率为720线逐行扫描。具体地说,是指分辨率在400线左右的VCD、DVD、电视节目等“标清”视频格式,即标准清晰度。
(2)高清:物理分辨率达到720p以上则称为高清,简称HD。关于高清的标准,国际上公认的有两条,即视频垂直分辨率超过720p或1080i,视频宽纵比为16:9。
(3)超高清:国际电信联盟最新批准的信息显示,“4K 分辨率(3840×216像素)”的正式名称被定为“超高清”。同时,这个名称也适用于“8K 分辨率(7680×4320像素)”。CEA 要求,所有的消费级显示器和电视机必须满足以下几个条件之后,才能贴上“超高清Ultra HD”的标签。首先屏幕最小的像素必须达到800 万有效像素(3840×2160),在不改变屏幕分辨率的情况下,至少有一路传输端可以传输4K 视频,4K内容的显示必须原生,不可上变频,纵横比至少为16:9。与此同时,美国消费者电子协会针对4K电视进行了一个官方的命名“UHDTV”,即“超高清电视”。
3.电视制式
电视制式种类有3种:PAL制、NTSC制和SECAM制。中国及德国使用PAL制式,韩国、日本及东南亚地区与美国等使用NTSC制式,俄罗斯、法国及东欧地区等使用SECAM制式,不同的制式之间互不兼容。因此,若视频拍摄机器是 DV,则在中国应选用 DV-PAL进行编辑。
4.帧速率
数字视频利用人眼的视觉暂留特性产生运动影像,因此,将每秒钟显示的图片数量称为帧速率,单位是帧/秒(fps)。
传统电影的帧速率为24帧/秒(24fps),PAL帧速率是25帧/秒(25fps),NTSC制帧速率为29.97帧/秒(29.97fps),SECAM 制帧速率也是25帧/秒(25fps)。不管什么制式,大于10帧/秒的帧速度可以在视觉上产生平滑的动画,反之画面则会产生跳动感。
5.场与场序
在将光信号转换为电信号的扫描过程中,扫描总是从图像的左上角开始,水平向前行进,同时扫描点也以较慢的速率向下移动。当扫描点到达图像右侧边缘时,扫描点快速返回左侧,重新开始在第1行的起点下面进行第2行扫描,行与行之间的返回过程称为水平消隐。一幅完整的图像扫描信号,由水平消隐间隔分开的行信号序列构成,称为一帧。扫描点扫描完一,帧后,要从图像的右下角返回到图像的左下角,开始新一帧的扫描,这一时间间隔,叫做垂直消隐。对于PAL制信号来讲,采用每帧625行扫描。对于NTSC制信号来讲,采用每帧525行扫描。
大部分的广播视频采用两个交换显示的垂直扫描场构成每一帧画面,这叫做交错扫描场。交错视频的帧由两个场构成,其中一个扫描帧的全部奇数场,称为奇场或上场;另一个扫描帧的全部偶数场,称为偶场或下场,如图1-1所示。场以水平分隔线的方式隔行保存帧的内容,在显示时首先显示第1个场的交错间隔内容,然后再显示第2个场来填充第一个场留下的缝隙。计算机操作系统是以非交错形式显示视频的,它的每一帧画面由一个垂直扫描场完成。电影胶片类似于非交错视频,它每次是显示整个帧的,一次扫描完一个完整的画面。
图1-1 隔行扫描与逐行扫描对比
第一场:对于隔行扫描视频,首先整个高场(奇数行)按从上到下的顺序在屏幕上绘制一遍。第二场:接下来,整个低场(偶数行)按从上到下的顺序在屏幕上绘制一遍。图1-1的下面部分是逐行扫描,对于非隔行扫描视频,整个帧(计数顺序中的所有行)按从上到下的顺序在屏幕上绘制一遍。
解决交错视频场的最佳方案是分离场。合成编辑可以将上载到计算机的视频素材进行场分离。通过每个场产生一个完整帧再分离视频场,并保存原始素材中的全部数据。在对素材进行如变速、缩放、旋转、效果等加工时,场分离是极为重要的。未对素材进行场分离,画面中会有严重的抖动、毛刺效果。
由于场的的存在,因此出现了场序的问题,也就是显示一帧时先显示哪一场。这并没有一个固定的标准,不同的系统可能有不同的设置。比如 DV 视频采用的是下场优先,而像Matrox公司的DigiSuite套卡采用的则是上场优先。影片渲染输出时,场序设置不对就会产生图像的抖动,在后期制作中可以调整场序。
6.脱机与联机
脱机(Off—line)编辑称为离线编辑,是指采用较大压缩比(如100:1)将素材采集到计算机中,按照脚本要求进行编辑操作,完成编辑后输出EDL表(编辑决策表),记录视音频编辑的完整信息。联机(On-line)编辑称为在线编辑,指先将EDL表文件输入到编辑控制器内,控制广播级录像机以较小压缩比(如2:1)按照EDL表自动进行广播级成品带的编辑,最终输出为高质量的成品带。在实际的制作中,常常将两者相互配合,利用脱机编辑得到EDL表,进而指导联机编辑,这样可以大大缩短工作时间,提高工作效率。
非线性编辑系统中有三种脱机编辑的方法。第一种方法是先以较低的分辨率和较高的压缩比录制尽可能多的原始素材,使用这些素材编好节目后将EDL表输出,在高档磁带编辑系统中进行合成。第二种方法是根据草编得到的EDL表,重新以全分辨率和小压缩比对节目中实际使用的素材进行数字化,然后让系统自动制作成片。第三种脱机编辑的方法是在输入素材的阶段首先以最高质量进行录制,然后在系统内部以低分辨率和高压缩比复制所有素材,复制的素材占用存储空间较小,处理速度也比较快,在它的基础上进行编辑可以缩短特技的处理时间。草编完成后,用高质量的素材替换对应的低质量素材,然后再对节目进行正式合成。
7.时间代码
为确定视频素材的长度,以及每一帧的时间位置,以便在播放和编辑时对其进行精确控制,需要用时间代码给每一帧编号,国际标准称为 SMPTE 时间代码,SMPTE 时间代码一般简称为时码。SMPTE时码的表示方法是:小时(h):分钟(m):秒(s):帧(f)。例如,一段长度为“00:03:20:15”的视频片段的播放时间为3分钟20秒15帧。
8.信号格式
摄像机拍摄图像时,通过扫描最初形成R、G、B三个信号,然后将RGB信号转换为亮度信号和色度信号。亮度信号 Y 是控制图像亮度的单色视频信号,而色度信号只包含图像的彩色信息,并分为两个色差信号B-Y与R-Y。由于人眼对图像中的色度细节分辨力低而对亮度细节分辨力高,因此对两个色差信号的频带宽度又进行了压缩处理,对于PAL制来讲,压缩后的色差信号用U、V表示。
YUV信号称为分量信号(component)格式,也被称为YUV颜色模式,是目前视频记录存储的主流方式。两个色差信号可以进一步合成一个色度信号C,进而形成了Y/C分离信号格式。亮度信号Y和色度信号C又可进一步形成一个信号,被称为复合信号(composite),也就是人们常说的彩色全电视信号。对同一信号源来讲,YUV 分量信号质量最好,然后依次降低。Premiere的内部运算支持YUV颜色模式,能够确保影片质量。
9.帧长宽比
帧长宽比用于描述图像尺寸中宽度与高度的比例。例如,DV NTSC具有4:3的帧长宽比(或4.0宽×3.0长)。为了进行比较,典型的宽银幕帧具有16:9的帧长宽比;许多具有宽银幕模式的便携式摄像机可以使用此长宽比进行录制,如图1-2所示。很多影片是使用更大的长宽比进行拍摄的。
图1-2 4:3帧长宽比(左侧)与16:9帧长宽比(右侧)
在使用不同的帧长宽比将剪辑添加到项目中时,必须明确如何协调各个值。在帧长宽比为4:3的标准电视上放映长宽比为16:9的宽银幕电影有两种方法。使用宽银幕式技术将16:9帧的整个宽度放到黑色4:3帧中。宽银幕帧的上方和下方将出现黑带。或者,使用全景和扫描技术只将16:9帧的选定区域填充到4:3帧中。虽然此技术消除了黑带,但也会让部分动作消失。
10.像素长宽比
像素长宽比描述帧的单一像素的宽度与高度的比例。由于不同的视频系统对填充帧时所需的像素数目的假设不同,因此像素长宽比是不同的。例如,许多计算机视频标准将具有4:3长宽比的帧定义为640×480像素。自身具有1:1长宽比的正方形像素完美填充了由帧定义的水平和垂直空间。然而,诸如 DV NTSC(美国的 DV 摄像机标准)等视频标准将4:3长宽比帧定义为720×480像素。因此,为了在帧中填充所有这些像素,像素必须比正方形像素窄。这些窄像素称为矩形像素,它们具有0.9:1(或通常称之为0.9)的长宽比。DV像素在生成NTSC视频的系统中采用垂直方向,而在生成PAL视频的系统中采用水平方向。Premiere Elements在【项目资源】面板中的剪辑图像缩览图旁显示剪辑的像素长宽比。
如果在正方形像素监视器上显示矩形像素,则图像会发生扭曲,例如,圆形会扭曲成椭圆。不过,当在广播监视器上显示图像时,这些图像会按照正确的比例出现,因为广播监视器使用的是矩形像素。系统可导出各种像素长宽比的剪辑而不失真。它可以将项目的像素长宽比自动调整为剪辑的像素长宽比。如果系统未正确地解释像素长宽比,剪辑可能会失真。可以通过指定源剪辑的像素长宽比来手动校正失真。如图1-3所示,左侧是正方形像素和4:3帧长宽比,中间是非正方形像素和4:3帧长宽比,右侧是非正方形像素在正方形像素监视器上显示有误。
图1-3 像素长宽比和帧长宽比
11.颜色模式
颜色模式可以理解为翻译颜色的方法,视频领域经常用到的是 RGB 颜色模式、Lab 颜色模式、HSB颜色模式和YUV颜色模式。
科学研究发现,自然界中所有的颜色,都可以由红(R)、绿(G)、蓝(B)三种颜色的不同强度组合而成,这就是人们常说的三基色原理。因此,R、G、B 三色也被称为三基色或三原色。把这三种颜色叠加到一起,将会得到更加明亮的颜色,所以RGB颜色模式也称为加色原理。对于电视机、计算机显示器等自发光物体的颜色描述,都采用RGB颜色模式。三种基色两两重叠,就产生了青、洋红、黄三种次混合色,同时也引出了互补色的概念。基色和次混合色是彼此的互补色,即彼此之间是最不一样的颜色。例如,青色由蓝、绿两色混合构成,而红色是缺少的一种颜色,因此青色与红色构成了彼此的互补色。互补色放在一起,对比明显醒目。掌握这一点,对于艺术创作中利用颜色来突出主体特别有用。
Lab颜色模式是由RGB三基色转换而来的,它是RGB模式转换为HSB模式的桥梁。该颜色模式由一个发光率(Luminance)和两个颜色(a、b)组成。它用颜色轴构成平面上的环形线来表示颜色的变化,其中径向表示色饱和度的变化,自内向外饱和度逐渐增高,圆周方向表示色调的变化,每个圆周形成一个色环。不同的发光率表示不同的亮度,并对应不同环形颜色变化线。它是一种“独立于设备”的颜色模式,即不论使用任何一种显示器或者打印机,Lab的颜色不变。
HSB颜色模式基于人对颜色的心理感受而形成,它将颜色看成三个要素:色调(Hue)、饱和度(Saturation)和亮度(Brightness)。因此这种颜色模式比较符合人的主观感受,可让使用者觉得更加直观。它可由底与底对接的两个圆锥体立体模型来表示,其中轴向表示亮度,自上而下由白变黑。径向表示色饱和度,自内向外逐渐变高。而圆周方向则表示色调的变化,形成色环。
YUV颜色模式由一个亮度信号Y和两个色差信号U、V组成,它由RGB颜色转换而成,前面已有所论述。
12.颜色深度
视频数字化后,能否真实反映出原始图像的颜色是十分重要的。在计算机中,采用颜色深度这一概念来衡量处理色彩的能力。颜色深度指的是每个像素可显示出的颜色数,它和数字化过程中的量化数有着密切的关系。因此颜色深度基本上用量化数,也就是位(bit)来表示。显然,量化比特数越高,每个像素可显示出的颜色数目就越多。8位颜色就是256色;16位颜色称为中(Thousands)彩色;24位颜色称为真彩色,就是百万(Millions)色。另外,32位颜色对应的是百万+(Millions+),实际上它仍是24位颜色深度,剩下的8位为每一个像素存储透明度信息,也叫Alpha通道。8位的Alpha通道,意味着每个像素均有256个透明度等级。
13.常见的视频格式
常见的视频格式有AVI、MPEG、MOV、RM等。
(1)AVI格式。
英文全称为Audio VideoInter leaved,即音频视频交错格式。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且压缩标准不统一。最普遍的就是高版本 Windows 媒体播放器播放不了采用早期编码编辑的 AVI 格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频。
(2)MPEG格式。
英文全称为Moving Picture Expert Group,即运动图像专家组格式,常看的VCD、SVCD、DVD就是这种格式。MPEG格式主要有三个压缩标准,即MPEG-1、MPEG-2和MPEG-4。
MPEG-1视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg 及 VCD 素材资源中的.dat文件等。
MPEG-2视频格式的文件扩展名包括.mpg、.mpe、.mpeg、.m2v及DVD素材资源上的.vob文件等。
MPEG-4视频格式的文件扩展名包括.asf、.mov和DivX AVI等。
(3)MOV格式。
MOV 格式是美国 Apple 公司开发的一种视频格式,默认的播放器是苹果的QuickTimePlayer。它具有较高的压缩比率和较完美的视频清晰度等特点,其最大的特点是跨平台性,即不仅能支持MacOS,同样也能支持Windows系列。
(4)RM格式。
用户可以使用RealPlayerRealOnePlayer播放器,对符合RealMedia技术规范的网络音频/视频资源进行实况转播;并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。
(5)RMVB格式。
这是一种由RM视频格式升级延伸出的新视频格式。先进之处在于RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源。
一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式,其个头最多也就400MB左右。不仅如此,这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。要想播放这种视频格式,可以使用 RealOnePlayer2.0或 RealPlayer10.0加RealVideo9.0以上版本的解码器形式进行播放。
除此之外,常见的可用做其他用途的视频格式还有 DV-AVI、FLV、ASF、WMV、RM等,不同的格式用在不同的软件环境中。