多媒体技术的实质是将以各种形式存在的媒体信息数字化,用计算机对它们进行组织与加工,并以友好的交互形式提供给用户使用。随着网络技术的发展,多媒体技术被广泛应用在商业、教育、文化娱乐等领域。本节将简单介绍多媒体技术的相关知识。
【了解】多媒体的特点。
与传统媒体相比,多媒体具有交互性、集成性、多样性、实时性等特点。
(1)交互性。
交互性是指多媒体系统向用户提供交互式使用、加工和控制信息的手段,从而使多媒体技术可应用于更加广阔的领域,为用户提供更加自然的信息存取手段。在多媒体系统中,用户可以主动地编辑、处理各种信息,实现人机交互。交互可以增强人们对信息的注意力和理解力,延长信息的保存时间。
(2)集成性。
多媒体技术集成了许多单一的技术,如图像处理技术、声音处理技术等。多媒体系统能够同时表示和处理多种信息,但对用户而言,这些信息是集成为一体的。这种集成表现在信息的统一获取、存储、组织、合成等方面。
(3)多样性。
多媒体技术的多样性不仅指图像、声音等信息表现形式的多样性,也指输入、传播、再现和展示信息的手段的多样性。多媒体技术使人们的思维不再局限于顺序、单调和狭小的范围,它扩大了计算机能处理的信息空间,使计算机不仅能处理数值、文本等,还能“得心应手”地处理更多种类的信息。
(4)实时性。
实时性是指多媒体系统中的声音、视频、图像都是实时的,这是多媒体系统的关键技术之一。多媒体系统能够综合处理具有时间关系的媒体,如音频、视频和动画,甚至实况信息媒体,这就意味着多媒体系统在处理信息时能够满足严格的时序要求和很高的速度要求。
多媒体个人计算机(Multimedia Personal Computer,MPC)是一种可以对多媒体信息进行获取、编辑、存储、处理和输出的计算机。
配置一台多媒体计算机需要以下部件。
● 一台高性能的微型计算机。
● 一些多媒体硬件,包括CD-ROM驱动器、声卡、视频卡、音箱(或耳机)等。另外,可以根据需要安装视频捕获卡、语音卡等插件,或安装数码相机、数字摄像机、扫描仪与触摸屏等采集与播放视频和音频的专用外部设备。
● 相应软件,包括支持多媒体的操作系统(如Windows XP、Windows Vista、Windows 7等)、多媒体开发工具和压缩/解压缩软件等。
在计算机和通信领域,最基本的媒体有声音和图像。
计算机系统通过输入设备输入声音信号,通过采样、量化操作将其转换为数字信号,然后通过输出设备输出。采样是指每隔一段时间对连续的模拟信号进行采集,每秒的采样次数即采样频率。采样频率越高,声音的还原性就越好。量化是指将采样后得到的信号转换为相应的二进制数值。量化位数一般为8位或16位。量化位数越大,采集到的样本精度越高,所需的存储空间也就越大。
采样和量化过程中使用的主要硬件是模拟/数字转换器(A/D转换器,它能实现模拟信号到数字信号的转换)和数字/模拟转换器(D/A转换器,它能实现数字信号到模拟信号的转换)。
经过采样、量化后,还需要对数值进行编码,即将量化后的数值转换为二进制数。有时也将量化和编码过程统称为量化。
最终产生的音频数据量按照以下公式计算。
音频数据量(B)=采样时间(s)×采样频率(Hz)×量化位数(b)×声道数÷8
存储声音信息的文件格式有很多种,如WAV、MIDI、VOC、AU及AIF等。
图像是多媒体中最基本、最重要的数据,图像有黑白图像、灰度图像、彩色图像、摄影图像等。在自然界中,景和物有两种形态,即动态和静态。静态图像根据其在计算机中生成的原理不同,可分为矢量图像和位图两种类型。动态图像根据获取方式的不同可分为视频和动画两种类型。
(1)静态图像的数字化。
一幅图像可以近似地看成是由许多点组成的,因此它的数字化通过采样和量化就可以完成。图像的采样是指采集组成一幅图像的点。量化是指将采集到的信息转换为相应的数值。组成一幅图像的每个点都称为一个像素,像素的值表示其颜色等属性信息。存储图像颜色的二进制数的位数称为颜色深度。
(2)动态图像的数字化。
人眼看到的一幅图像消失后,该图像还会在视网膜上滞留几毫秒,动态图像依据这样的原理,将静态图像以每秒 n 幅的速度播放,当 n ≥25时,显示在人眼中的就是连续的画面。
(3)点位图和矢量图。
表达或生成图像时通常有点位图和矢量图两种方法。点位图是指将一幅图像分成很多个像素,每个像素用若干二进制数表示其颜色等属性信息。矢量图是指用一些指令来表示一幅图像,如画一条200像素长的红色直线、画一个半径为100像素的圆等。
(4)文件格式。
图像文件的格式包括BMP、GIF、TIF、PNG、WMF、DXF等。
视频文件的格式包括AVI、MOV等。
【熟记】多媒体数据压缩的方式。
多媒体信息数字化后的数据量非常大,需要经过压缩才能满足实际需求。数据压缩分为无损压缩和有损压缩两种类型。
无损压缩是利用数据的统计冗余进行压缩的方式,又称可逆编码,其原理是统计被压缩数据中重复数据的出现次数并对该重复数据进行编码。无损压缩能够确保解压后的数据不失真,能实现对原始对象的完整复制。它的主要特点是压缩比较小,广泛应用于文本数据、程序以及重要图形和图像的压缩。常用的无损压缩编码方法如下。
(1)行程编码。
行程编码(Run Length Encoding,RLE)简单直观,编码和解码的速度快;其压缩比与压缩数据本身有关,行程长度大,压缩比就大。它适用于用计算机绘制的图像,如BMP、AVI格式的文件。由于彩色照片的色彩丰富,采用行程编码时压缩比会较小。
(2)熵编码。
根据信源符号出现概率的分布特性进行码率压缩的编码方式称为熵编码,也称统计编码。其目的是在信源符号和码字之间建立一一对应关系,以便在恢复时能准确地再现原信号,同时使平均码长或码率尽量小。熵编码包括霍夫曼编码和算术编码。
霍夫曼编码依据字符出现的概率来构造异字头的平均长度最短的码字,又称最佳编码。它将文件中出现频率较高的符号用较短的位序列代替,而将那些很少出现的符号用较长的位序列代替。这种方式一般用来压缩文本和程序文件。
算术编码与其他编码方法的不同之处在于,其直接将整个输入的信息编码为一个小数 。算术编码的优点是每个传输符号都不需要被编码成整数“比特”。虽然算术编码的实现方法比较复杂,但它的性能通常优于霍夫曼编码。
在人们从互联网接收的信息中,图像和视频占据了大部分,JPEG和MPEG作为常见的图像、视频格式,具有占用存储空间小、清晰度高等优点,被广泛应用于互联网信息传播中。JPEG标准是为静态图像建立的第一个国际数字图像压缩标准,也是现在应用最广的图像压缩标准。JPEG标准可以提供有损压缩,其压缩比是其他传统压缩算法无法比拟的。MPEG标准是一种高效的压缩标准,它规定了声音数据和电视图像数据的编码与解码过程、声音和数据之间的同步等问题的解决方案等。MPEG-1和MPEG-2标准为数字电视标准,MPEG-4是基于内容的压缩编码标准,MPEG-7是“多媒体内容描述接口标准”,MPEG-21是有关多媒体框架的协议。
有损压缩又称不可逆编码,是指压缩后的数据不能完全还原成压缩前的数据,解压后的数据与原始数据不同但是非常接近的压缩方法。有损压缩也称破坏性压缩,以损失文件中的某些信息为代价来换取较大的压缩比,其损失的信息多是对视觉和听觉感知不重要的信息。有损压缩的压缩比通常较大,常用于音频、图像和视频的压缩。典型的有损压缩编码方法如下。
(1)预测编码。
预测编码根据离散信号之间存在一定相关的特点,利用前面一个或多个信号对下一个信号进行预测,然后对实际值和预测值之差进行编码和传输,再在接收端把差值与实际值相加,恢复原始值。在同等精度下,预测编码能用比较少的“比特”进行编码,以达到压缩数据的目的。预测编码中典型的压缩方法有脉冲编码调制(PCM)、差分脉冲编码调制(DPCM)、自适应差分脉冲编码调制(ADPCM)等。
(2)变换编码。
变换编码先对信号进行某种函数变换,从一种信号空间变换到另一种信号空间,然后再对信号进行编码。变换编码包括变换、变换域采样、量化和编码4个步骤。典型的变换有离散余弦变换(DCT)、离散傅里叶变换(DFT)、沃尔什-哈达玛变换(WHT)、小波变换等。量化将处于取值范围 X 的信号映射到一个较小的取值范围 Y 中,压缩后的信号比原信号所需的比特数少。
(3)基于模型的编码。
如果把预测编码和变换编码等基于波形的编码称为第一代编码技术,则基于模型的编码就是第二代编码技术。其基本思想是在发送端利用图像分析模块对输入图像提取紧凑和必要的描述信息,得到一些数据量不大的模型参数;然后在接收端利用图像综合模块重建原图像,对图像进行合成。
(4)分形编码。
分形编码是利用分形几何中的自相似原理实现的。它先对图像进行分块,然后寻找各块之间的相似形(由仿射变换确定,一旦找到了每块的仿射变换,就保存这个仿射变换的系数)。由于每块的数据量远大于仿射变换的系数,所以图像得以大幅压缩。
(5)矢量量化编码。
矢量量化编码是在图像、语音信号编码技术中研究较多的新型量化编码方法之一。矢量量化是一种限失真编码方法,其原理仍可用信息论中的信息率失真函数理论来分析。