医学图形图像处理（全国中医药行业高等教育“十四五”规划教材）最新章节_章新友著

1.2.1　医学图像概述

现代医学越来越离不开医学图像提供的信息，医学图像在疾病的诊断、分期及选择治疗方法和手段等方面起着决定性的作用。由于医学图像能够直观地反映患者的病情，因此大大提高了医生诊断的准确率。现代科学已经证明，人们通过图像获得的信息占其获得的总信息的70%以上，这在医学领域也不例外，医学图像能够最大限度地向医生提供患者的信息。医生在临床上越来越依赖医学图像，医学图像在现代医学中占有越来越重要的地位。

1.医学图像的描述 不同的文献上，对图像的描述是不同的。概括来说，对图像的描述分为如下几种。

（1）图形、图像与多媒体对象在计算机图形学中，图形、图像和视频（一种运动图像，后面将详细介绍）是有区别而又相互联系的概念。从直观上说，图形（graphics）的含义要较图像更广泛。图形主要是指利用计算机产生的字符、专用符号、点、线和面所构成的图，但现在也包括由计算机的外部设备（如扫描仪、摄像机）输入的或由计算机本身生成的照片图像。

现代科技文献一般将图形定义为可“用数学方法描述的图形”，其余的景象、形象、图像则一般笼统称为图像（image）。图像是指照片图像，其图案不是以字符、符号、线或面为单位，基本组成是点（dot）或像素（pixel）。不过现在图形图像已不能也不需要加以严格区分了。可以认为图像是图形的一种，图形也可以看成是图像。因此，在现在的计算机软件中，多数情况下，图形图像处理是包含在同一个软件中的。

图形图像是从结构上区分的，图形图像文件分为两种，即位图和矢量图。在位图中，图像由许多的屏幕小点（通常说的像素）组成，这些小点对应“显存”中的“位”，就是这些“位”决定了像素的图像属性，如像素的颜色、灰度、明暗对比度等。当一个像素所占的位数多时，它所能表现的颜色就更多、更丰富，从整体上看，图像的色彩就更艳丽，分辨率就更高。位图中所分的二位图、八位图等，正是指“像素”所占的位数。当位图被放大或缩小时，由于像素的数量没有改变，图像的分辨率就会降低，图像的外观自然就大打折扣。就这方面来看，位图的缺点显而易见，表现在以下方面：①分辨率的固定导致大分辨率的清晰图像占用大量空间。②像素的分散性使动态图像的表达比较困难。

为此，研究人员开发出了一种新的图形格式——矢量图。矢量图就是用矢量代替位图中的“位”。矢量图不再给图的全部“像素”做统一的标记，而是用矢量对图的几何部分做标记。一幅矢量图是绿色背景，上有一个黑色的圆圈。它的表达方式是先用语句调用调色板描述背景，再用带矢量的数学公式来描述圆圈的大小、形状等，这就使得图形的放大、缩小和移动变得十分简单，仅仅是改变公式中的矢量变量就可以。

从理论上讲，矢量图的优点是很多的。①矢量图能无限放大、缩小而不失真。②不需要将图像每一点的状态记录下来，因而比相同质量和大小的位图占用的空间少得多，它甚至可以方便地通过更改内部公式制作动画。

矢量图与图形对应。图形用形状参数和属性参数（参数表示法）来表示。形状参数可以是描述其形状的数学方程的系数、线段的起始点及终止点等；属性参数则包括灰度、色彩、线型等非几何属性。参数表示法突出了图形的数学描述，强调了图形的“形”的概念，即几何概念。

位图与图像对应。图像更注重“点”的信息，强调的是像素，是平面的“点”构成复杂的图案，图像用像素的差别来表示三维图案。

图像的表示是用具有灰度或色彩的“点阵”来表示，图像点阵类似于矩阵，矩阵的某一位置的值，表示该处的灰度或色彩。虽然矩阵仍然是一种数学概念或方法，但这里强调的是“灰度”而不是“形”。即构成图形的要素不仅有形状，而且有明暗、灰度和色彩等这样一些属性。

虽然图形与图像是两个不同的概念，但它们又不能截然分开。图形可以转换成图像，随着光栅显示器的发展和广泛应用，图形的显示及处理常用图像的方式方法进行，如直线的生成、圆弧的生成、区域的填充等。而图像也可以使用图形的某些处理方法，如把图像经过细化等处理而变成线画图（图形），从而可以用图形的某些方法进行处理。

从多媒体的角度看，图像是除代码文本（如ASCII文本）和与时间相关数据（即随时间改变而变化的数据）之外的所有数据形式。即图像所有对象都以图形（非文本）或编码的形式表现，并且那些在连续的演示间无直接时间关系的，也属于这一组对象。这里包括的数据类型有文档图像、传真系统、分形位图、元文件和静止画面（或静止视频的帧等）。

图1-1描述了图像中对象类别的等级。这个等级中，图像被认为是可视或不可视的，以及产生可视图像的纯数学函数。

图1-1　图像等级

可视图像：可视图像组包括图（如蓝图、工程图、医疗单位布局图等）、文档（作为图像而扫描得来的）、画（扫描的或由计算机绘图应用软件生成的）、摄影照片（扫描后或直接由电子相机采集的）以及由视频相机捕获的静止帧等。

所有这些情形中，图像都在一定的时间间隔内以完整位图形式存在，位图中包括由输入装置捕获的每个像素。所有输入装置，不论它们是扫描仪还是视频摄像机，都用扫描的方法来获取预先定义的坐标格中像素的颜色和强度。坐标格的范围可从典型的视频标准，即满帧340×240这一级别，一直到分辨率高达600像素/英寸。几乎每种情况中，都要使用某种类型的压缩方法来减少图像的整体容量。

除了存储以压缩形式存在的图像内容外，还有必要存储一些信息，包括使用的压缩算法类型，以便使图像可在目标工作站上成功地解压缩。一些系统中，已经假定所有图像将以某种特定压缩方法进行压缩，所以就不用存储这个信息了。但仍有必要存储关于图像分辨率、方向和标识的信息。这是专用文档图像系统最通用的方法。

不可视图像：不可视图像是那些不作为图像存储，但作为图像显示的图像。这些图像包括气压计、温度计及其他度量的显示等。

抽象图像：抽象图像实际上并不是那些存在于真实世界中的对象的图像或显示，而是基于一些算术运算的计算机生成的图像。分形是这类图像的一个极好例子，绝大多数分形是由计算机产生的算法生成的，这些算法试图显示它们可以生成的各种不同模式组合，就像一个万花筒可以显示各种图形是由于万花筒转动时，玻璃珠相对位置不同而产生的。

离散函数可产生在时间尺度上保持不变的静止图像。连续函数用于显示动画的图像及类似于以下这样的操作，即一幅图像隐退或融于其他的图像。

（2）静态图像、动态图像与视频影像　静态图像是指一幅图像显示出来，在不对其进行修改时它在长时间内是不变的，是静止不动的。运动图像（动态图像）对应视频（video）图像，如电视信号一样，这种图像显示出来按照一定的频率在不断地变化，产生动感效果。

动态图像指能“动”起来的图像，又称为活动图像。动态图像的原理是利用了人眼的视觉残留，即人眼所见的物体在消失后仍会在人眼中保持0.05～0.1秒的影像，当这些单个的画面连续地、快速地、一幅接一幅地播放时，人眼看到的画面是在连续地变化。插入的中间状态画面越多，被描述的运动越平滑、越逼真。实验表明，当播放速度达到每秒10帧左右时，运动已经很连续，当每秒24帧以上时（电视机每秒25帧），则画面丝毫没有不连续的感觉了。

运动图像是由若干静态图像组成的，每幅静态图像在运动图像中称为一帧（frame），对计算机显示或视频输出来说，一帧就是相对不变的一个画面或一幅图像。运动图像变化的快慢是由帧率来度量的，帧率是指每分钟动态地显示多少帧图像，它的单位是帧/分钟（frames/second或frames per second，fps）。

当然，并不是所有的视频影像都必须来源于电视信号，视频影像也可以用软件来产生。任何一幅图像都可以作为视频影像的一帧。使用诸如Video Edit之类的软件，可以选择或绘制各种任意的图像，并将它们排好队，用软件打包生成一个视频影像文件，同样的道理，也可以按照某种运动的要求，由计算机自动生成每一帧图像。如用著名的软件Mopher，可以将一张照片渐变到另一张照片，并将其过程生成一段视频影像。

视频影像可以表示为一个帧图像的序列，如果把每帧图像分别存储，一个视频影像就会对应很多文件。为解决这一问题，实际的做法是，将所有的帧打成一个包，用一个文件来表示。通常视频影像是以压缩的方式存储的，文件中存储的是所有帧经压缩后的结果。播放时，先经过解压缩得到每一帧的图像，然后在屏幕上显示（视频影像格式一般还需具有存储伴音，并提供同步机制）。而且计算机必须记录每一段声音与画面的同步关系，即使播放画面的速度快了，也可以等待声音信号，做到同步播放。

根据动态图像专家组（moving photograph expert group）公布的Mpeg1标准，对应于NTSC制式，为了在计算机上获得运动图像的连续的视频效果，运动图像的每帧大小为352×240×15位近似真彩色，帧率为30fps；而对应于PAL制式，为了在计算机上获得运动图像的连续显示效果，运动图像的每帧大小为352×288×15位近似真彩色，帧率为25fps。这就是VCD（video CD，视频压缩光盘）中存储的运动图像要还原（restore）或回放（playback）时应该达到的指标。

DVD（digital video disk，数字视频光盘）运动图像，是技术指标更高的运动图像。

（3）模拟图像与数字图像　人们在日常生活中接触到的各类图像，如前述的照相机所拍的照片、医学用的X线底片等一类的光学图像，以及眼睛所看到的一切景物图像等，这一类的自然图像称为模拟图像。它们都是由连续的各种不同颜色、亮度的点组成的。这类图像只能用摄像机、照相机等进行摄取。

计算机只能处理数字信息，要使模拟图像能在数字计算机中进行处理，就必须将模拟图像转换为用一系列数据所表示的图像，这样表示的图像称为数字图像。将模拟图像转换成数字图像的过程，称为图像数字化。

用表1-1将两种图像进行比较后就会发现，图像数字化后有许多明显的优点。

表1-1　模拟图像与数字图像的比较

数字图像的优点具体表现在以下几个方面。

①灵活性大。通常对模拟图像如照片等只能进行几种有限的处理，即只能对模拟图像进行线性转换，如对照片进行放大、缩小等处理，这就无疑会大大地限制了其能完成的处理工作。与其相反的是，数字图像对计算机而言实际就是一组数据，这些数据当然可以按用户意愿任意修改，故对数字图像不仅可以进行线性转换，还可以进行非线性转换。如可以对数字图像进行变形、融合等处理，也就是说，凡是可以用数学公式或逻辑运算公式表达的一切运算，都可以对数字图像进行相应的转换。

②精度高。目前的技术几乎可以将一幅模拟图像数字化为任意大的二维数组，如可以对每毫米采样80个或更多的像素点，每个像素的亮度可以量化为12bit，这样的精度已是非常高了，和彩色照片已无多大区别，完全可以满足绝大多数的需要。

③再现性好。模拟图像如照片，即使使用了非常好的底片和相纸，也会随着时间的消耗而褪色，而且，照片在放大时，一般很难保持一样的光滑。数字图像不同于模拟图像，它不会因存储、传输或复制而产生图像质量的退化，从而很容易在各种场合下准确地再现、复制原图像。

2.医学图像的数字化 医学图像（包括静态图像和时变图像）属于可视化信息。早期的医学图像是胶片，如X线照片等。今天的医学图像则主要是通过CRT显示出来的，用于显示图像的数据通常来自CT、磁共振等医用设备。窥镜显示时变图像，窥镜图像一般要用图像采集卡来获取。还有些医学图像是医生手工绘制的。医生手绘图及各种相关图片，要经数字化后，方可输入计算机处理。一般由扫描仪来做输入工作。扫描仪的功能是把连续的原始图像数字化、离散化，成为计算机可以接收的信息，然后由计算机按一定的格式将图像储存起来，由彩色扫描仪得到的图像通常是24位真彩色的（衡量扫描仪性能的一个重要指标是它的最大分辨率）。医生手绘图像输入的另一种方法是使用电脑软件。

（1）图像的数字化过程　图像的数字化过程通常可分为采样和量化两步。由于模拟图像是由无数个点组成的，这无数个点对应着无数个信息，计算机无法采用其所有的信息，而是在模拟图像上按一定规律采用一定数量的点的数据，这个过程就称为采样。

采样的具体过程：以一定间隔将图像在水平方向和垂直方向上分割成若干个小区域，每个小区域是一个采样点，即对每一个小区域只采用一组数据，每一个采样点对应计算机屏幕上的一个像素，采样的结果将使整幅图变成每行有 m 个像素，每列有 n 个像素，全图是 m × n 个像素点的集合。自然，因每个采样点是分开的，各个像素点也是分开的，即是离散的。

量化就是用一定的数据来表示每个采样点的颜色、亮度等信息。把采样后的每个像素点的亮度用一定的数字（1～255）来表示，这就是量（数量）化。一般量化后，每个像素的亮度值用一个字节（8bit）表示，则总共有1～255个灰度值表示像素点的亮度。

经采样、量化后，一幅模拟图像就转换成一幅适合在数字计算机上处理的数字图像。

然而，采样、量化这两步过程都有大量的信息没有被采用，即被忽略掉，因此在同一幅模拟图像和数字图像之间必然会有一定的误差，即数字图像没有模拟图像精确。但是由于人眼的空间分辨率和亮度分辨率都是有限的，因此只要适当地选取采样间隔与量化的灰度级数，上述误差是可以忽略不计的。也就是说，人眼睛是分辨不出采样后的数字图像和模拟图像之间的区别的。

（2）医学图像的处理　图像根据其表现的内容可以分为二维图像与三维图像（习惯上称为三维图形）。当然不管什么图像，它们最终都是显示在一个二维平面上的（如显示屏），三维图像是特指那些具有三维透视效果的图像，其他不具有三维透视效果的图像就称为二维图像，它们表达的只是二维平面内的形状。使用三维图像的目的是为了逼真地模拟现实世界，给人以更形象生动的感觉。与二维图像不同，三维图像通常还需要进行诸如消隐、着色、光照、质地与纹理等多方面的处理，好的三维图像几乎可乱真，但同时它需要大量的计算机运算时间。

所谓虚拟现实就是通过特殊的观察装置，由二维图像观察出三维图像的效果来。输入立体图像的形状相对较困难，对于简单几何结构的立体图像（如大楼）可以输入描述图像的主要的参数点坐标。对于不规则的立体形状（如人头部）就困难了，这需要特殊的立体化数字仪来测定人头曲面各点的空间坐标。再一个方法是获得该形状各个剖面的轮廓（如用CT技术），然后将各个层面的轮廓用平面数字化仪输入到计算机，在计算机中再造整个形状。

为了让计算机按照人的意愿产生图像，必须告诉计算机各种有关的参数。计算机按照这些信息来绘制图像。这些信息可以通过键盘输入，也可用鼠标输入。数字化仪是另一种专用的图像坐标输入工具，适用于将已有的实物形状输入计算机。这与用扫描仪的输入是不同的，将地图扫描进计算机得到的是地图的图像，计算机可以显示这幅地图，但对地图中的位置信息是一无所知的。而用数字化输入的地图，计算机精确地知道地图中的位置信息，因而可以在相关位置上面做各种计算与查询。

由于造型动画不是以帧画面的方式来记录的，一段一般复杂程度的动画所占的空间，通常要比时间长度、幅面大小及帧速度相同的视频影像要小得多。所谓医学影像处理，从广义上说，就是将医学上的各种图像（如显微镜下图像、CT图像、彩超图像等）通过高质量的医用图像采集卡和计算机，将其变为一个计算机可识别的文件，从而实现对医学图像的处理。相对来说，本书所指的图像处理主要是指基于计算机软、硬件平台，用数字方式进行图像分析的技术。其具体内涵：①医学图像的采集、采集系统和医学图像的采集技术；②医学图像的显示、输出及相关技术；③对医学图像的编码、压缩、存储和传输技术；④医学图像的二维处理技术；⑤医学图像的三维成像技术；⑥与医学图像处理密切相关的其他技术。

3.医学图像技术的发展 一般来说，影像与图像并没有本质的区别，医学影像也只是习惯成自然的称呼。影像医学在20世纪是医学领域中知识更新最快的学科之一。1895年德国科学家伦琴发现了X线并由此产生了X线成像技术（X-radiography）。X线的发现彻底改变了传统的靠“望、闻、问、切”等手段对患者进行诊断的方式。它第一次无损地为人类提供了人体内部器官组织的解剖形态照片，使诊断准确率得到了大幅度提高，X线的发现为现代医学影像技术的发展奠定了坚实的基础。20世纪50年代到60年代开始使用超声与放射性核素扫描进行人体检查，出现了γ-闪烁成像（γ-scintigraphy）和超声成像。20世纪70年代和80年代又相继出现了计算机断层成像（computed tomography，CT，或称计算机体层摄影）、磁共振成像（magnetic resonance imaging，MRI）和发射型计算机断层成像（emission computed tomography，ECT）。仅100多年的时间就形成了包括X线诊断的影像诊断学（diagnostic imageology）。20世纪70年代介入放射学（interventional radiology）的迅速兴起，扩大了医学影像学对人体的检查范围，提高了医学诊断水平，并且可以对一些疾病进行治疗。近20年来，在计算机技术迅猛发展的带动下，医学影像学已经成为医学领域发展最快的学科之一。常规X线成像正逐步从胶片转向计算机放射摄影（computed radiography，CR）或更为先进的直接数字化摄影（digital radiography，DR）的数字化时代。与计算机紧密相关的CT和MRI发展速度惊人。CT从早期单纯的头颅CT发展为超高速多排螺旋CT、电子束CT，扫描最薄层厚也从早期的10mm到现在的0.5mm以下，图像分辨率已经达到1024×1024。MRI也已发展为超导、高场强，分辨率在常规扫描时间下提高了数千倍，磁共振血管成像（magnetic resonance angiography，MRA）已成为常规检查项目，同时磁共振功能成像及磁共振波谱（MRS）技术正在飞速发展之中。

随着CT、MRI、介入放射学等影像技术、影像诊断、影像治疗和磁共振的相继问世，医学影像从无到有、从小到大，经历了一个飞速的发展过程。当今医学影像技术进入了全新的数字影像时代，医学影像技术的发展反映和引导着临床医学在诊治以及随诊方面的进步。医学影像技术的发展，在某种意义上代表着医学发展潮流中的一个热点趋势，推动了医学的发展，尤其是介入放射学的出现，使放射从单纯的诊断演变为既有诊断又有治疗的双重职能，并在整个医学领域中占有举足轻重的地位，成为与内、外、妇、儿等并列的主要临床学科。

1.2.1 医学图像概述

1.2.1　医学图像概述