购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2.4 多媒体信息在计算机中的表示

1.多媒体与多媒体技术 媒体(media)在计算机领域有两种含义:一是指传播信息的载体,如语言、文字、图像、视频、音频等;二是指存贮信息的载体,如ROM、RAM、磁带、磁盘、光盘等(图1-10)。目前,多媒体信息的存储载体有移动硬盘、优盘、光盘、网络存储器等。多媒体技术中的媒体主要是指信息传播媒体。

图1-10 多媒体应用

多媒体一词源自20世纪80年代初出现的英文单词multimedia。多媒体就是由媒体复合而成的,是融合两种以上媒体的人机交互式信息交流和传播的媒体。多媒体具有以下特征。

(1)多样性 指信息媒体的多样性,即文本、图形、图像、动画、音频及视频等多种信息。

(2)交互性 交互性指用户可以与计算机的多种信息媒体进行交互操作,从而为用户提供更加有效地控制和使用信息的手段。

(3)集成性 集成性指以计算机为中心综合处理多种媒体信息,包括信息媒体的集成和这些媒体设备的集成。这种集成包括信息的多通道统一获取,多媒体信息的统一存取、组织与合成等方面。硬件方面,具有能够处理多媒体信息的高速及并行CPU系统、大容量的存储、适合多媒体多通道的输入输出能力及带宽的通信接口。对软件来说,应该有集成一体化的多媒体操作系统。

(4)媒体信息的数字化 媒体信息的数字化是针对现实中的模拟信号而言的,如我们现实中看到的和听到的信息都是时间上连续的模拟信号。到目前为止,使用最为广泛的计算机依然是数字计算机,因此媒体信息在计算机中主要是以数字化形式存在。图像通过数码相机、扫描仪、绘图软件等输入计算机。常规计算机是用二进制进行信息处理的,在用计算机处理图片之前需要先进行数字化。视频信息由一连串相关的静止图像组成,组成视频的一幅图像称为一个帧,在用计算机进行视频处理时同样需要进行数字化。

(5)媒体信息的实时性 实时性是指多媒体系统对声音和视频等媒体提供实时处理的能力,是指声音、动态图像(视频)随时间变化,各种信息有机结合,同步出现。在多媒体信息远程传输中,多路多媒体信息传输的实时性尤为重要,解决的常用方案是打包、多线程机制、多内存轮流。流媒体(streaming media)是一种新兴的网络传输技术,包括流媒体数据采集、视/音频编解码、存储、传输、播放等领域。流媒体的体系构成包括:编码工具,用于创建、捕捉和编辑多媒体数据,形成流媒体格式;流媒体数据;服务器,用于存放和控制流媒体的数据;适合多媒体传输协议甚至实时传输协议的网络;播放器,供客户端浏览流媒体文件。

多媒体技术就是利用计算机把文字、图形、图像、动画、声音及视频等媒体信息数字化,并将其有机集成在一定的交互式界面上,使计算机具有交互展示不同媒体形态的功能。多媒体技术利用计算机技术把文本、图像、图形、动画、音频及视频等多种媒体综合一体化,使之建立起逻辑上的联系,并能够对它们获取、编码、编辑、处理、存储、传输、再现。

多媒体技术的出现极大地改变了人们获取信息的方式及阅读方式。多媒体技术被广泛应用于人们生产生活当中,包括咨询、图书、教育、通信、军事、金融、医疗等诸多行业,并潜移默化地改变着人们生活的面貌。

2.多媒体信息处理技术

(1)数字压缩技术 数字化时代数据的存储容量相当庞大,这给存储器、通信干道及计算机的处理速度带来了极大的压力。为了解决这一问题,单纯靠扩大存储容量和增加传输带宽会使成本大大提高,对多媒体数据进行压缩编码是解决存储和传输问题的有效途径。采用恰当的编码算法对图像、音频和视频进行压缩,既能节省存储空间,又能提高通信介质的传输效率,同时也使计算机实时处理和播放多媒体信息成为可能。

多媒体数据的压缩技术主要分为无损压缩和有损压缩两种。

无损压缩是利用数据的统计冗余进行压缩,可完全恢复原始数据而不引起任何失真,但压缩率受到数据统计冗余度的理论限制,一般为2∶1到5∶1。这类方法广泛用于文本数据、程序和特殊应用场合的图像数据(如指纹图像、医学图像等)的压缩。由于压缩比的限制,仅使用无损压缩方法不可能解决所有图像和数字视频的存储和传输问题。经常使用的无损压缩方法有Shannon-fano编码、Huffman编码、游程(run-length)编码、LZW(lempel-ziv-welch)编码、算术编码等。

有损压缩利用人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息。虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响小,而换来的是较大的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。在多媒体应用中,常见的压缩方法有PCM(脉冲编码调制)、预测编码、变换编码等。如多媒体中音频格式mp3、wma,图像格式jpg,视频格式rm、rmvb、wmv等采用的都是有损压缩。

(2)数字音频处理技术

1)数字音频的概念:声音是一种波,最简单的声音表现为正弦波。表述正弦波需要三个物理参数:一是振幅,即振动的大小,用于衡量声音产生的压力大小,代表声音的强度;二是周期,即振动的间隔;三是频率,用于衡量声音每秒振动的次数,声音的振幅是连续值。

多媒体技术处理的声音主要是人耳可听到的20Hz~20kHz频率范围内的音频信号。频率低于20Hz的声音叫作“次声”,高于20kHz的声音叫作“超声”。频率范围被称为“频带”或“带宽”。不同种类的声源产生的声音频带也不相同。人的说话声,即话音或语音,频带为200~3400Hz。现实世界中人可感知的其他声音,如音乐声、风雨声、汽车声等,频带为20Hz~20kHz。

数字音频信号是多媒体技术主要采用的音频形式,自然界的声音、语音和音乐都能通过数字音频信号来表达。由于数字音频信号本身可以通过计算机进行加工和处理,使得音频效果更加丰富完美,因此广泛应用于多媒体展示系统、多媒体广告、视频特技等领域。

①模拟音频与数字音频:以模拟录音等方式所获得的连续音频信号即为模拟音频信号,模拟音频信号经量化后所得到的离散数据就是数字音频信号。

②音频的数字化:将连续的模拟声音信号转换成计算机可处理的二进制数字编码的过程称为声音信号的数字化。声音的数字化过程包括采样、量化和编码三个过程。

采样是按照固定的时间间隔截取音频信号的振幅值,所以采样是把时间上连续的信号转换成时间上离散的信号。量化是把每个样本从模拟量转换成数字量。量化的是声音的幅值,即声音的大小。编码就是将量化后的整数值用二进制数来表示。为减少数据量,编码时往往要进行数据压缩,以便于计算机存储和处理及在网络上进行传输等。

2)数字音频文件格式:数字化音频文件依据编码方式的差别形成不同的格式。音频格式数不胜数,而且还在不断丰富中。为了方便用户使用和传播,主张采用符合国际统一标准或由行业权威机构制定并得到广大用户承认的格式。目前常用的声音文件有以下类型。

①WAV格式:这是Windows系统存储数字声音的标准格式,主要用在PC上。该格式目前已成为一种通用的数字声音文件格式,几乎所有的音频处理软件都支持WAV格式。由于WAV格式存放的是未经压缩的音频数据,所以文件占用空间很大(如1分钟的CD音质需要10MB),不适于在网络上传播。

②MIDI格式:MIDI(musical instrument digital interface)是计算机描述乐谱的语言,是数字乐器与计算机通信的国际标准。在MIDI文件中存储的是一些指令,把这些指令发送给声卡,由声卡按照指令将声音合成出来。

③CDA格式:即CD-DA文件,在Windows环境中使用CD播放器播放。其采样率为44.1kHz,每个采样值使用16位二进制存储。这种文件的特点是音质好,但数据量大。

④WMA和ASF格式:WMA和ASF都是微软公司开发的新一代网上流式数字音频压缩技术。特点是同时兼顾了保真度和网络传输要求。这种格式在录制时可调节音质,音质堪比CD,压缩率较高,可以用于网络传播。

⑤RA和RM格式:这两种扩展名的音频文件是Real公司开发的流式声音文件,可一边下载一边播放。流式文件可以随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较大的听众获得较好的音质。

⑥VQF格式:VQF是日本YAMAHA公司购买NTT公司的技术而开发的一种音频压缩格式。它的压缩比高于MP3,音质也好于MP3。但由于VQF是YAMAHA公司的专有格式,能支持播放这种格式的播放器相当有限,所以普及程度不如MP3。

⑦MP3格式:MP3就是一种采用MPEG-1层3编码的高质量数字音乐,它能以10倍左右的压缩比降低高保真数字声音的存储量,码率为每秒112~128kb(每分钟约1MB),一张普通CD光盘上可以存储大约100首MP3歌曲。MP3支持声音和数据的复合,播放音乐时,可播放或显示其他相关信息。MP3是目前最流行的音乐格式,WinAMP软件播放MP3非常出色,也可使用MP3随身听等来播放。

从音质角度,对常见声音的回放效果做一个简单的比较,由好至差的顺序为:MIDI+电子乐器>音乐CD>WMA>MP3>RA。

WAV文件格式最为通用,能适合各种应用程序和场合;WMA与RA都具有流媒体特性,适合网上实时收听,但WMA音质比RA要高很多。

(3)数字视频处理技术

1)数字视频的概念:视频信息是来源于现实世界的运动画面和伴随画面的音频信息的总称,一般可以通过摄像机拍摄而产生,各种电视画面是最常见的视频形式。与音频信号相似,按照存储与处理方式的不同,视频信号同样分为模拟视频和数字视频。模拟视频信号是以连续的模拟信号方式存储、处理和传输的视频信息,所用的存储介质、处理设备及传输网络都是模拟的。传统的电视技术即为模拟视频技术。在20世纪50年代,以模拟视频信息为基础的电视技术开始兴起,之后随着计算机技术和数字信号处理技术的飞速发展,从20世纪70年代起,数字视频技术逐步发展,到20世纪90年代以后,网络技术的发展给数字视频技术带来了新的机遇和广阔的应用领域。由于数字视频的诸多优点,目前,模拟视频正在逐步被数字视频所取代,并且应用到了许多新的领域。

2)数字视频文件格式:数字视频以文件形式保存在计算机的硬盘中。由于视频数据的来源及压缩、编码方式等方面的不同,数字视频有多种文件格式,下面介绍主要的视频文件格式。

①音频视频交错格式(audio video interleaved,AVI):AVI格式是将语音和影像同步组合在一起的文件格式。它于1992年被Microsoft公司推出,随Windows 3.1一起被人们所熟知。AVI支持256色和RLE压缩,这种视频格式的优点是图像质量好,可以跨多个平台使用;其缺点是体积过于庞大,并且压缩标准不统一,导致高版本Windows媒体播放器播放不了采用早期编码技术的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码技术的AVI格式视频。因此,用户在进行一些AVI格式的视频播放时,常会出现由于视频编码问题而造成视频不能播放,或者即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题。不过,这些问题可以通过下载相应的解码器来解决。

②活动图像专家组(moving picture experts group,MPEG):MPEG是专门制定多媒体国际标准的一个组织。该组织成立于1988年,由全世界大约300名多媒体技术专家组成。该格式包括MPEG视频、MPEG音频和MPEG系统(视、音频同步)三个部分。

MPEG压缩标准是针对运动图像而设计的,基本方法:在单位时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧发生的变化,以达到压缩目的。MPEG压缩标准可实现帧之间的压缩,其平均压缩比可达50∶1,压缩率比较高,且又有统一的格式,兼容性好。

③高级串流格式(advanced streaming format,ASF):ASF是Microsoft为Windows 98所开发的串流多媒体文件格式。音频、视频、图像以及控制命令脚本等多媒体信息通过这种格式以网络数据包的形式传输,实现流式多媒体内容发布。其中,在网络上传输的内容称为ASF串流格式。ASF支持任意的压缩/解压缩编码方式,并可以使用任何一种底层网络传输协议,具有很大的灵活性。

④WMV格式:WMV格式是Microsoft推出的另一种流媒体格式,是ASF格式升级延伸出来的。在同等视频质量下,WMV格式的体积非常小,很适合在网络播放和传输。WMV文件一般同时包含视频和音频部分。视频部分使用Windows Media Video编码,音频部分使用Windows Media Audio编码。

⑤RM与RMVB格式:RealNetworks公司所制定的音频和视频压缩规范主要包含RealAudio、RealVideo和RealFlash三部分。其中RealAudio用来传输接近CD音质的音频数据,RealVideo用来传输不间断的视频数据,RealFlash是一种高压缩比的动画格式。

RM(real media)格式的主要特点:文件小,但画质仍能保持得相对良好,适于在线播放;可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率网络上进行影像数据实时传送和播放。

RMVB格式是在流媒体的RM格式上升级延伸而来。VB即VBR,是variable bit rate(可改变之比特率)的英文缩写。RMVB打破了原先RM格式平均压缩采样的方式,在保证平均压缩比的基础上,设定了一般为平均采样率两倍的最大采样率值。将较高的比特率用于复杂的动态画面(歌舞、飞车、战争等),而在静态画面中则灵活地转为较低的采样率,合理地利用了比特率资源,使RMVB在牺牲少部分察觉不到的影片质量情况下,最大限度地压缩了影片的大小,最终拥有了近乎完美的接近于DVD品质的视听效果。

⑥MOV格式:MOV即QuickTime影片格式,是Apple公司开发的一种音频、视频文件格式,用于存储常用数字媒体类型,如音频和视频。QuickTime支持领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。无论是在本地播放还是作为视频流格式在网上传播,它都是一种优良的视频编码格式。QuickTime采用了有损压缩方式的MOV格式文件,所以具有跨平台、存储空间要求小等技术特点,其画面效果较AVI格式要稍好一些。到目前为止,它共有4个版本,其中以4.0版本的压缩率最好。这种编码支持16位图像深度的帧内压缩和帧间压缩,帧率每秒10帧以上。目前,某些非线性编辑软件可以对它进行处理,其中包括Adobe公司的专业级多媒体视频处理软件Aftereffect和Premiere。 9BpYkhXI/dhTVm3cctqQ1eX0TD2QCqiW+qZSQ3DffGKsCB84p0TjyM0JOSTJyrTY

点击中间区域
呼出菜单
上一章
目录
下一章
×