大学计算机基础教程（WPS版）最新章节_桂洁著

2.6 多媒体信息编码

多媒体是多种媒体的复合，除了文字以外，还包括图形图像、声音、视频、动画等多媒体信息。这些多媒体信息需要经过模拟量数字化的过程，在计算机中以二进制形式来处理和存储，其过程和形式要比汉字复杂许多。多媒体信息编码有多种方式，不同的编码方式会产生不同的格式文件。

2.6.1 图像和图形的编码

1.图像和图形的基本知识

图像则是指由输入设备捕捉的实际场景画面或以数字化形式存储的任意画面，是可以直接通过照相、扫描、摄像得到，也可以通过绘制得到，一般为位图。图形一般指用计算机绘制的画面，是人们根据客观事物制作生成的，它不是客观存在的，一般是矢量图。

（1）位图

位图也称为点阵图或像素图，计算机屏幕上的图是由屏幕上的像素构成的。位图文件中存储的是每个像素点用二进制数据来描述位置信息、颜色信息以及灰度信息。可以将点阵图想象成是由一个个很小的颜色小方块组合而成的图片，每个小方块代表 1 px（像素）。位图的质量由分辨率决定。表现一张位图的分辨率越高，像素点就越多，图像就越清晰，同时图片文件所占的空间就越大。其缺点是，当图片放大之后会越来越不清晰，也就是会出现一个个点，就像马赛克一样，图片出现失真。

（2）矢量图

矢量图也称为面向对象的图形或绘图图形，是用数学方式描述的曲线即曲线围成的色块制作的图形。矢量文件是数学方程、数学形式对图形进行描述，通常是用图形的形状参数和属性参数来表示图形。矢量图和分辨率是没有关系的。因此，图片放大、缩小或旋转都不会失真，不会出现位图的马赛克的样子，也就是说可以无限放大图片。

2.图像的编码

图像的编码是一种将视觉信息转化为计算机可以存储和显示的数字信号的过程，也就是将每个像素点的颜色信息转化为二进制码的过程。编码的过程包括三个步骤。

（1）采样

所谓采样，就是把一幅连续图像在空间上分割成 m × n 个网格，一个网格就是一个像素点，每个像素点再用一个亮度值来表示。 m × n 也就是这幅图像的分辨率。比如，一幅图像的分辨率为 1 920 × 1 080 像素，表示图像水平方向有 1 920 个像素点，垂直方向有 1 080 个像素点。图像的像素点越多，分辨率越高，图片质量越高。

（2）量化

图像经过采样后，在空间上已经被离散化为像素，但采样所得的像素值（即灰度值）依然是连续量。把采样后所得的各像素连续的灰度值转换为离散化的整数值的过程称为量化。量化后的图像的每个像素具有位置和灰度两个属性。位置由行、列表示，灰度则表示该像素位置上亮暗程度的整数。每个像素点采用多少位数值来表示颜色（灰度值），决定了该像素点能够表示的颜色数量，反映了图像的质量。

每个像素点的颜色用二进制表示。比如：黑白图像可用 1 位的二进制表示，1 表示纯白，0 表示纯黑；灰度图像可以用 8 位的二进制（1 个字节），表示 256 种灰度级别的单色图像；24 位真彩色图像（RGB）是将三原色红、绿、蓝分别用 8 位表示，需要用 24 位二进制表示，构成 2 ²⁴ =16 777 216 种颜色。

（3）压缩编码

数字化后的图像数据量特别大，为了有效地传输和存储图像，有必要压缩图像的数据量。原始图像数据是高度相关的，存在很大的冗余。图像越有规则，其自相关系数越大，图像的空间冗余就越大。数据冗余会造成空间浪费，而压缩就是为了消除这些冗余。对于人的感知器官来说，除去这些图像信息并不会明显降低所感受的图像质量。

图像压缩编码技术从不同的角度出发，有不同的分类方法。根据压缩过程有无信息损失，可分为有损编码和无损编码。根据压缩原理进行划分，可以分为预测编码、变换编码、统计编码、小波变换图像压缩编码等。

2.6.2 声音的编码

在自然界中，声音是一种物理现象，是由物体振动产生的能量传播。当物体振动时，周围的空气、水或固体介质也会随之振动，形成一系列疏密变化的波动。这些波动以周期形式的波形在介质中传播，从而产生我们能够感知到的声音。现实中的声音是模拟信号，为了便于存储、传输和处理，在计算机中需要将模拟信号转换为数字信号，即声音数字化的过程。

声音数字化是指将模拟信号按照固定的频率通过采样、量化和编码将其转换为数字信号，过程如图 2-6 所示。

图 2-6 声音的编码过程

1.采样

采样是将模拟音频信号波形进行分割，把连续的模拟信号转换为离散的数字信号（即模/数转换，A/D转换）。每隔一个时间间隔在模拟声音波形上取一个幅度值，采样的时间间隔称为采样周期，其倒数为采样频率。采样频率是指计算机每秒采集多少个声音样本。采样频率越高，数字信号的分辨率越高，但同时所需的存储空间和处理能力也越大。

2.量化

在数字音频技术中，把采样得到的表示声音强弱的模拟电压用数字表示。模拟电压的幅值仍然是连续的，而用数字表示音频幅度时，只能把无穷多个电压幅度用有限个数字表示，即把某一幅度范围内的电压用一个数字表示，这个过程称之为量化。用多少位二进制位来表示一个采样值，称为量化位数（也称量化精度）。量化位数越多，数字信号的精度越高，但所需的存储空间也越大。

3.编码

编码是按照一定的格式记录采样和量化后的数据。常见的音频编码的格式有很多种，如PCM、ADPCM、MP3 等。通常所说的音频裸数据指的是脉冲编码调制（PCM）数据，其优点是抗干扰能力强、失真小、传输特性稳定，但编码后的数据量较大。