生物与非生物在分子构成方面有一个根本性的差别:生物体拥有特殊类型的分子——生物大分子,其主要类型包括核酸、蛋白质、多糖和脂类。不论是简单的微生物,还是复杂的动植物,都离不开这几种生物大分子。顾名思义,生物大分子的分子量巨大,单个生物大分子的分子量从几万到几千万不等。更重要的是,生物大分子就如同用众多砖块砌成的建筑物一样,是由许许多多作为结构单元的有机小分子相互聚合而成的多聚化合物,并拥有这些有机小分子所不具备的特性。要想搭建生物大分子,不仅需要共价键这类强键,而且需要氢键等各种弱键的参与,还需要这两类化学键精密的协同作用。
最重要的生物大分子当属核酸(Nuclear Acid);这是生命用于存储和传递遗传信息的主要物质载体,主要有两类,核糖核酸(简称RNA)和脱氧核糖核酸(简称DNA)。核酸的结构单元称为核苷酸(Nucleotide);每个核苷酸由一分子碱基、一分子核糖(脱氧核糖)和一分子磷酸结合而成,其中碱基与核糖通过糖苷键连接形成核苷,然后核苷中的核糖与磷酸以酯键相连接;不同的碱基形成不同的核苷酸。组成RNA的核苷酸有4种类型,都含有核糖,并分别含有4种不同的碱基,包括腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U);DNA的脱氧核苷酸也是4种,都含有脱氧核糖,并分别含有腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶(T)4种碱基。在核酸形成的过程中,相邻两个核苷酸之间的磷酸残基与糖基上的羟基通过脱水缩合反应形成酯键,而多个核苷酸残基相互以酯键连接就形成了链式结构的多聚核苷酸分子(图1.6)。病毒的核酸分子的长度通常是数千个核苷酸,而动物细胞的一条DNA链可以拥有数千万到上亿个核苷酸。更重要的是,在DNA链或者RNA链上的每个核苷酸种类都可以改变,而这些核苷酸的排列顺序通常就决定了特定的遗传信息。
图1.6 核苷酸聚合形成具有方向的核酸链
与核酸同等重要的生物大分子是蛋白质(Protein),这是各种生命活动的主要执行者,例如作为酶的蛋白质负责在机体内催化各种化学反应。蛋白质与核酸相比,虽然前者的种类远远超过后者,但是二者的构成规则都是一致的,即由基本的结构单元相互连接而成。蛋白质的结构单元是氨基酸(Amino Acid),用于构造蛋白质的天然氨基酸有20种,这些氨基酸除甘氨酸外均为L构型,即这19种氨基酸上的碳原子均为不对称碳原子(Cα),这个不对称碳原子除了分别与氨基(NH 2 )和羧基(COOH)两种官能团以及一个氢原子连接以外,还与一个可变基团(R)相连;不同的氨基酸上有不同的R基团。通常根据R基团的疏水性质将20种天然氨基酸分为两大类:8种疏水氨基酸(非极性氨基酸)和12种亲水氨基酸(极性氨基酸);后一类又可再分为7种极性不带电荷的氨基酸和5种极性带电荷的氨基酸。在这20种天然氨基酸中,任意两个氨基酸可以通过脱水缩合反应使一个氨基酸的Cα与另一个氨基酸的NH 2 之间形成酰胺键(通常称为肽键);多个氨基酸之间相互以肽键连接而成的一个链状分子就称为一条多肽链;一条多肽链可以有几十个氨基酸残基,也可以有高达数百个氨基酸残基。不同的蛋白质多肽链上具有不同种类的氨基酸残基,这些不同种类的氨基酸残基及其排列顺序决定了蛋白质的结构和功能。
多糖(Polysaccharide)又称为碳水化合物,通常作为生物体的结构材料和能源的提供物。多糖也是一种由单糖作为基本结构单元聚合而成的生物大分子。单糖按碳原子数目可分为丙糖、丁糖、戊糖、己糖等;也可按官能团分为多羟基醛或多羟基酮,分别称为醛糖和酮糖;因此,葡萄糖称为己醛糖,果糖则称为己酮糖。自然界存在的一般都是D型单糖。相邻的两个单糖通过脱水缩合反应形成糖苷键;由至少10个以上的单糖通过糖苷键连接而成的糖链称为多糖,而10个以下的单糖形成的糖链则称为寡糖。由相同的单糖聚合而成的多糖称为同多糖,常见的有纤维素、淀粉和糖原;例如纤维素是由数百个乃至上万个D型葡萄糖以β-1,4糖苷键连接而成;它是植物细胞壁的主要结构成分,占植物界碳含量的50%以上。以不同类型的单糖组成的多糖则称为杂多糖,例如透明质酸,由D-葡萄糖醛酸和N-乙酰-D-葡萄糖胺组成,在动物体内通常分布于结缔组织中,具有润滑和吸收水分的功能。自然界存在的杂多糖通常只含有两种类型的单糖,并且大多与脂类或蛋白质结合形成糖脂和糖蛋白。
脂类是脂肪(Fat)和类脂(Lipid)的总称。脂肪是由一分子甘油和三分子脂肪酸结合而成的甘油三酯;而类脂主要包括磷脂和胆固醇。脂类分子严格意义上说不能称为生物大分子,因为许多脂类分子的相对分子质量不过是几百到一千左右,而且也不是像上述3类生物大分子那样的通过若干个单体连接而成的多聚化合物。但是,脂类也是生物体特有的分子,并且在生物体的结构和功能方面扮演着重要的角色:脂肪是生物体重要的能源物质,磷脂和胆固醇则是细胞膜和细胞内膜结构的基本组成部分。因此,许多教科书也常常把脂类称为第4种类型的生物大分子。脂肪酸(FatAcid)是脂类分子的主要构成部分,可以根据碳链长度分为三种,碳链上的碳原子数小于6的称为短链脂肪酸;碳链上碳原子数为6—12的称为中链脂肪酸;碳链上碳原子数大于12的称为长链脂肪酸。在高等动植物体内,以碳原子数为16和18的长链脂肪酸最为常见;显然,食物所含的大多是长链脂肪酸。此外,脂肪酸根据碳链上碳原子间是否有双键又可分为两类,没有碳碳双键的称为饱和脂肪酸,带有一个或几个碳碳双键的称为不饱和脂肪酸。
为了让众多有机小分子的“砖块”能够紧密聚合在一起,构成稳定的生物大分子“大厦”的基本框架,需要采用共价键这种“强键”进行连接,如RNA或DNA多核苷酸链的形成依靠磷酸残基与核糖的羟基反应形成的磷酸二酯键,而蛋白质多肽链的形成则依靠相邻的两个氨基酸残基之间的碳原子与氮原子反应形成的肽键。共价键是典型的强键,具有很高的键能。通过共价键形成的分子通常具有比较稳定的化学结构,因此,依靠共价键连接成的生物大分子也是很稳定的;共价键可以说是生物大分子的“脊梁骨”。
要在原子间形成共价键不是一件轻而易举的事情,尤其对于处在常温常压状态下的生物而言更不容易。一方面是因为共价键的键长很短,例如碳碳键为0.15纳米,需要让两个原子靠得很近才有可能发生反应;生物体为此需要采用酶等各种特殊措施;另一方面是因为形成共价键的反应能阈较高,需要提供很多的能量才能实现反应;生物体在这类聚合反应中消耗了大量的三磷酸腺苷(ATP)等高能物质。尽管困难重重,代价很大,生物体依然把利用共价键来制造生物大分子作为其首要任务,因为只有这样的生物大分子才能够满足生命的有序性需求。
有序性的一个重要特点是,物体的结构或功能活动有着明确的方向 。构成生物大分子的各种单体通常都是属于具有手性的不对称有机小分子,这些单体在构成生物大分子的时候有明确的方向性,进而使得生物大分子也具有特定的方向性。这种方向性离不开共价键的贡献。在DNA或者RNA多核苷酸链中,前一个核苷酸的核糖的3'-羟基和下一个核苷酸的核糖的5'-羟基分别与磷酸残基通过酯化反应相连,形成了3',5'-磷酸二酯键,从而每条多核苷酸链的一端为5'末端,另外一端为3'末端(图1.6)。蛋白质的多肽链也存在明确的方向,一端有氨基残基,称为N端;另外一端有羧基残基,称为C端。有时同一种结构单元的同分异构体也可以被用来形成不同的生物大分子。例如,环状结构的D-葡萄糖有α及β两种异构体,α-葡萄糖的1号碳原子和4号碳原子连接的羟基是同一方向,而β结构则正好相反(图1.7)。纤维素与淀粉是典型的多糖类生物大分子,二者的结构单元相同,均是由葡萄糖以1,4糖苷键连接而成的;但纤维素采用的是β-1,4糖苷键,而淀粉采用的是α-1,4糖苷键。
图1.7 葡萄糖的同分异构体
由此可以看到,手性有机小分子利用聚合反应将其不对称性进一步放大,形成了具有特定方向的、高度有序的生物大分子。这种生物大分子的方向性决定了生物体功能活动的基本特点:高度的选择性和专一性。DNA在细胞里是以两条多核苷酸链相互平行缠绕的双螺旋方式存在,其中一条链的方向是3'端到5'端,而另一条链的方向则是5'端到3'端。这种反向平行结合的方式决定了DNA双螺旋的直径为2纳米,并使得DNA两条多核苷酸链内侧的4个碱基只能按照腺嘌呤对应胸腺嘧啶(A与T)和鸟嘌呤对应胞嘧啶(G与C)的关系互相以氢键相连;这就是著名的“碱基互补原则”。可以说多核苷酸链的方向性就是遗传信息保存和传递的基础。我们知道,作为催化剂的蛋白质——酶在其参与的化学反应中有着非常专一的反应底物。例如,α-葡萄糖苷酶只能够分解含α-1,4糖苷键的多糖,β-葡萄糖苷酶则只能够分解含β-1,4糖苷键的多糖。人类拥有α-葡萄糖苷酶而缺少β-葡萄糖苷酶,因此可以消化淀粉而不能消化纤维素。又如,细菌为了保护自身的遗传稳定性,常常采用一种“限制性核酸内切酶”来降解入侵的外源DNA。这种限制性核酸内切酶在进行酶切反应时不仅依赖特定的碱基序列,而且其断开磷酸二酯键的位点也是很专一的,即切断3'-磷酸酯键。
生物大分子的有序性非常精妙,贯穿在生命活动的方方面面。在生物大分子聚合反应中,需要提供能量使得有机小分子“结构单元”之间形成共价键;为此,参加聚合反应的每个有机小分子单体都带有一个可提供反应能量的高能磷酸键,如核苷三磷酸或活化的氨基酸。然而,这些高能磷酸键的使用却出现了两种不同的聚合模式:对于核酸合成来说,采用的是“尾端聚合”方式,即在这种多核苷酸链的延长过程中,每次聚合反应使用的高能磷酸键来自参加反应的核苷酸单体;对于蛋白质合成来说,则采用了“头端聚合”方式,即在这种多肽链的每次聚合反应中,使用的高能磷酸键来自分子延长链的一端,而非参加反应的氨基酸单体(图1.8)。这两类能量利用方式具有不同的生物学意义。“尾端聚合”方式使得在生物大分子聚合过程中链的延长不会被轻易地终止;这一点在DNA合成中特别重要,因为在DNA链的延长过程中,有时会连接上一个携带错误碱基的核苷酸,需要通过“碱基错配修复”机制把错误的核苷酸切除,并重新接上一个携带正确碱基的核苷酸;显然,只有“尾端聚合”方式才能保证这种修复方式的进行。而“头端聚合”方式在链的延长过程中则不能提供这种修复机制,因为一旦把多聚体的链末端提供高能磷酸键的单体切除,链的聚合反应就不能再继续了。显然,这两种聚合方式对应两种生物大分子合成:不能修复的错误多肽链随时可以抛弃,再重新合成一条就可以了;而多核苷酸链则不可能这样随便地抛弃,尤其是DNA链。
图1.8 生物大分子链聚合模式示意图
需要强调的是,共价键并不是像“水泥”那样仅仅简单地把有机小分子“砖块”连接起来,而是在搭建高度有序的生物大分子中发挥着重要的作用。常见的共价键有两种,单键和双键;通常情况下,单键两侧的原子可以相对自由地旋转,这种分子会非常柔韧;而双键上的原子在同一平面,不能自由旋转,其分子具有很强的刚性。饱和脂肪酸的碳链上碳原子间都是碳碳单键,因此它是非常柔软的分子,具有范围很广且不太稳定的构象。但是,研究者发现,蛋白质上连接氨基酸残基的肽键(C—N键)虽然是单键,却具有部分双键的性质,难以自由旋转而有一定的刚性,从而导致连接肽键两端的C O、N—H和2个Cα共6个原子的空间位置处在一个相对接近的平面上,称为“肽键平面”(图1.9)。然而,蛋白质内的肽键平面之间却可以通过连接它们的α碳原子进行旋转,进而可以形成α螺旋等空间构象。
图1.9 氨基酸通过肽键聚合形成肽键平面的示意图
由此不得不感叹,大自然真是一个高明的“设计师”! 蛋白质通常要利用肽键把不同的氨基酸残基按照一定的顺序连接起来,在此基础上形成特定的结构来执行相应的功能。为此要满足“刚柔兼顾”的设计要求:蛋白质一方面需要相对稳定的分子构象,以折叠成正确的立体结构;另一方面又需要氨基酸残基之间有一定的柔性,以满足蛋白质折叠过程和功能活动。 肽键作为具有部分双键性质的单键,既避免了纯粹单键中原子可自由旋转引起的构象不稳定性,又避免了纯粹双键中原子被紧紧固定在同一平面的刚性限制,使得蛋白质具有一定的刚性,同时又有一定的柔性。
有机小分子单体通过共价键相互聚合形成多聚链只不过是完成了构造生物大分子的第一步;要成为有功能的生物大分子,这些二维的线状多聚链还需要进一步折叠或组装来形成更高级的三维结构。要实现这样的任务,仅仅依靠共价键是不够的,还需要另外一类“次级键”(Secondary Bond)的参与。
次级键属于比共价键或离子键要弱的化学键,因此也常被称为“弱键”,主要有氢键(Hydrogen bond)、范德华力(vander Waals force)、疏水作用力(Hydrophobic force)等。对生物大分子而言,最重要的次级键要属氢键,这种键比共价键和离子键弱很多;其键能一般在5—30kJ/mol之间。氢键的成键方式使其具有饱和性和方向性。当一个氢原子与一个电负性大的原子X(例如氧原子或者氮原子)形成共价键后,若该氢原子与另一个电负性大的原子Y接近时,就会作为质子供体与这个原子Y发生静电作用而形成氢键(通常用X—H…Y来描述);在这种情况下,其他电负性大的原子就难以再接近氢原子;这就是氢键的饱和性。在形成氢键时,X—H…Y在同一条轴线上时键能最强,形成的氢键最稳定;如果不在同一条轴线时,键能变弱,氢键稳定性降低;因此氢键具有方向性。重要的是,这种方向性给氢键带来了很好的“柔性”,即键能可强可弱。
上文说到,蛋白质多肽链中多个肽键平面通过连接它们的α碳原子沿中心轴旋转并卷曲形成右手α螺旋;此时相邻螺旋之间形成链内氢键,即上一个螺旋的第一个肽键平面N上的氢原子与下一个螺旋的第一个肽键平面羰基上的氧原子形成氢键。因此,氢键是稳定α螺旋的主要作用力;若这个氢键断裂,则α螺旋构象就被破坏。氢键也是DNA双螺旋碱基配对的关键力量:在两条反向平行的多核苷酸链中,腺嘌呤(A)与胸腺嘧啶(T)形成两个氢键,胞嘧啶(C)与鸟嘌呤(G)形成三个氢键,使得这两对碱基的空间构型基本一致,并且都能满足DNA双螺旋的空间要求。
不过,维持DNA双螺旋结构稳定的主要作用力并不是氢键,而是一种称为“碱基堆积力”的次级键。这种力属于疏水作用力,即相邻的具有疏水性芳香环的碱基在DNA双螺旋结构中彼此堆积在一起,将水分子排挤出去,在DNA内部形成一个疏水核心;这不仅有利于互补碱基间形成氢键,而且使DNA双螺旋结构维持稳定。疏水作用力同样也是蛋白质折叠的主要驱动力。蛋白质通常存在于水相环境中,由于水分子彼此之间的相互作用要比水与非极性分子的作用更强烈,因此氨基酸残基上的大多数非极性侧链避开水彼此靠近,并聚集在蛋白质内部,而大多数极性侧链则在蛋白质表面保持着与水的接触。这种疏水相互作用不仅推动了蛋白质三级结构的形成,而且维持了α螺旋等二级结构的稳定。
生物体为什么不直接用有机小分子来负责生命活动,而要如此大费周章地制造生物大分子?一个最重要的理由是, 生命活动只有通过生物大分子之间的相互作用才能实现。生命活动从不依靠生物分子的“单打独斗”,全都是团队合作的产物 ;不论是生物体之间传宗接代的遗传信息传递活动,还是生物体内实现新陈代谢的化学反应,都需要众多生物大分子之间的相互配合和相互调控。例如,动物细胞用来合成蛋白质的装置——核糖体(Ribosome)就是一个拥有RNA链和80多种蛋白质的复合物。弱键正是在生物大分子之间的相互作用中扮演了极为重要的角色。
“活着”是一件很不容易的事,要求高,变化快,还要适应各种复杂的环境;即使是大肠杆菌这样简单的微生物,每时每刻都在进行着成百上千的化学反应,需要成千上万不同种类的分子参加。据统计,一个大肠杆菌拥有的蛋白质数量就达到2.4×10 6 。对生物体来说,分子的数量还不是主要的问题,关键是那些负责实施某种生命活动的分子“团队”要能够准确地从种类繁多、数量巨大的分子群中相互识别,然后聚集在一起协调一致地“干活”。显然,生物分子之间如何识别就成为生物体首先要考虑的问题。为此,生物体特意选择了氢键或疏水作用力等次级键作为生物分子之间相互识别的主要手段。由于次级键的形成与分子构象或形状有关,所以正确的分子识别一定是分子间形状能够精确地“互补”而形成恰当的次级键。此外,由于大量的生物分子拥挤在一个狭小的活动空间“游来荡去”,难保无关的分子也能随机地碰到一起并生成一两个次级键;因此,正确的分子识别需要在形状复杂和体积较大的生物大分子间展开,这样的生物大分子之间一旦形状互补,就能够形成一定数量的弱键来确保它们连接成一个稳定的整体;而那些随机碰到一起的生物大分子,即使它们之间产生一两个弱键,也不能把它们稳定在一起。可以这样说, 生物大分子的出现就是为了保证分子间的正确识别 。
也许我们要问,如果采用共价键的话,有机小分子之间也能够进行正确地识别;为什么生物体不采用共价键来执行分子识别的任务?原因在于共价键是强键,成键不容易,断键也不容易。而生命活动是一个高度动态过程,参与活动的分子组分时而结合在一起,时而又要分开。换句话说, 生物体内的分子识别必须是一个高度可逆的行为;而只有氢键等弱键能够满足这种高度可逆性的需求 。因此,虽然生物大分子间的识别偶尔也会采用共价键,但是绝大部分生物大分子间的相互作用都是通过弱键来实现的。