购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
系统生物学中的基本概念

上世纪 60 年代早期出现了生物学研究侧重点的分歧。首先,分子生物学的出现快速促进了科学界对DNA(脱氧核糖核酸,遗传信息的主要承载者)、蛋白质以及细胞中的其他化学成分的理解。分子生物学催生了精确分析化学及受控实验等方面的技术,分子生物学与细胞的生物化学及遗传学功能具有较好的关联性,偶尔也与生命体的表型相关。而依赖生理学技术研究生命整体效益的生物学,由于其难以提炼猜想、难以执行受控实验以及不易测试生命系统和生物网络中独立科学过程等特点,正退出主流研究领域。然而正如本书前述章节中介绍,这种情况正随着生物技术的不断革新而改变。最新生物技术可以提供生命系统组件的细节数据,并允许我们将细胞和复杂生命过程作为完整系统来研究。因此,系统生物学已发展成为一门新的生物学分支。这个新领域还没有形成具有严格清晰定义的概念。所以本章将尝试给出系统生物学的主要概念和关键技术的定义。本章仅仅是系统生物学概念基础的尝试定义,肯定无法包含系统生物学的所有内容。

2.1 组件与系统

所有生物组件都有一个生存期。大部分代谢分子在细胞中生存不会超过 1 分钟,人细胞中的mRNA分子通常有 2 个小时的半衰期 [256] ,而有 3%的心脏肌肉细胞的细胞外基质可以有 1 天的生存期。所以如果想比较细胞今天和昨天的情况,可能只有很少一部分的细胞内分子是一样的。同样,细胞也只有有限的生存期。人骨髓细胞大约存活 2—3 天,皮肤细胞在 5 天到几个星期之后就被新细胞代替,肠道内皮细胞可以存活 5—7 天,而像肝这样生长缓慢的组织器官细胞可以有大约一年的细胞生存期。所以生命体当前的细胞都是近几年新生长出来的。然而不管一个人的年龄有多大,我们都认为这是同一个人。同样,即使一个细胞中的化学分子已经完全更新,我们仍然认为原细胞与一周后更新的细胞是一样的。生命系统中的组件总是在不断更新,因此一个生命系统的关键是生物组件如何互相连通。细胞和细胞组件的互联定义了生命的本质。

生命体的组件视角与系统视角在很多细节处有较大差异。下面通过图2.1 中的例子来展示这些不同点。

图2.1:生命体组件视角和系统视角的差异

●图2.1 左边从组件视角展示了基因产物的功能。当我们考察如图例中酶这样的基因产物功能时,我们把这个生物组件与它的底物一起放在一个实验容器中,然后观察这个底物消失的时序过程以及产物的产生过程。我们研究的这个组件就是该实验的中心,它导致了底物和产物的浓度时序变化。

●图右展示了一个生化网络的系统视角图形(视图)。与组件视图相反,系统视图不强调每一个组件及其状态的重要性,而是关注系统的整体情况。任何一个生物网络都有一个平衡状态来反映其一般情况。因此,形成网络状态的组件之间的相互作用流(flux)被称为决定变量(dominant variable),而每一个组件的浓度就称为“附属量”(subordinate quantity)。网络组件的浓度主要由相互作用流图(flux map)决定(即网络状态),也与网络中相互作用边的动力学属性关系较大。

2.2 关联边与功能状态

前面的讨论中出现了两个关键概念。第一个概念描述了生物网络中组件之间关联边的特点,后者描述了由一组关联边形成的网络具有的属性和功能状态。

◆ 关联边(link)

分子组件之间的关联边主要是由生化组件之间的化学反应或者关联决定,所以这些关联边主要由基本化学规则所描述与限定。在组织生物学中,细胞之间的关联边属性更复杂,由更高维度的化学机理决定。譬如T细胞受体可以在细胞膜上形成复杂的结构。这样的复杂结构与其他细胞的相关属性的兼容性决定了细胞之间是否存在有效通信(即关联边)。因为本文主要关注生物化学网络的特点,所以下文将进一步讨论分子生物学中关联边的化学特点。

分子层面的生命系统原型变换是双线性的。双线性关系描述的是两个组件之间的共价键断开或形成的化学反应,正如一个代谢反应或者大分子合成反应,

X + Y X Y 共价键

或者两个分子通过氢键或其他物理作用力来形成复合物,产生与组件不一样的功能,

X + Y X Y 分子关联

这样的关联可以描述转录因子与DNA的结合来形成一个激活位点,使得激活的聚合酶可以结合上来。这样的两个分子之间的双线性关联也包括变构调控因子与变构酶的结合来产生空间结构变化的酶。

化学变换具有如下关键特点:

(1)化学计量法。化学反应的化学计量法是确定的,采用确定的整数描述参与反应及反应产物的化学分子。因此化学计量法描述的是化学反应的数字信息。化学转换受限于元素及电荷平衡以及其他特性。不同物种之间的同一个反应的化学计量法是不变的,不会随着压力、温度或其他外界条件的变换而变换。化学计量法给出了一个生化反应网络的基本拓扑属性。

(2)相对速率。一个细胞中的所有反应都满足热动力学原理。反应的正向或反向相对速率由基本热动力学属性来决定。不像化学计量法那样,热动力学属性会随着生理生化环境属性而改变,譬如压力和温度。大分子之间关联的热动力学属性可以随着蛋白质或DNA的序列改变而调整。细胞内部的小分子之间热动力学转换随环境变化有所变化,但是也依赖一定的条件。

(3)绝对速率。与化学计量法和热动力学原理不同,化学反应的绝对速率在细胞中是非常容易改变的。快速进化的酶可以专门性催化特定化学转换。细胞因此可以通过改变其DNA序列,从而显著改变这些反应的速率。

因此,关联边不可能在任意两个细胞组件之间随意形成。一个关联边需要满足两个生物组件之间的共价键和分子表面热动力学限制条件。所有这些限制条件还要满足化学和热动力学基本规律。绝对速率也是生物系统设计中的关键变量,因为它们可以从非常低的由分子碰撞概率决定的反应速率进化为非常高的特异性酶催化速率。如图2.2 所示,催化酶进化使分子进入特定的方向以控制两个分子之间适当取向的碰撞,从而导致化学反应。

图2.2:一个催化酶如何通过调整两个分子的空间角度来促进它们之间结合效率的图例。子图1 描述溶液中两个分子以任意角度进行碰撞。只有很少一部分的碰撞有可能形成两个分子之间的实际结合。子图2 描述了一个催化酶通过结合并控制两个分子的空间角度大大提高两个分子之间化学反应概率。图片来源:参考文献[122]

◆ 功能状态

如果一个网络中所有关联边都被检测并刻画好,那么这个网络的功能状态也可以确定。我们可以研究一个网络的拓扑特性,不过这些特性只给出了网络功能状态的部分信息。一个生物反应网络的功能状态由细胞内环境的生理生化特性所决定,如图2.3 所示。一种高度发展的时空组织方式可以指引生物组件,并决定相互作用的短期机理。很有趣的是,生物学家发现细胞实际上是以近乎晶体的状态存在的。细胞质和线粒体中的蛋白质密度与蛋白质晶体中的密度近乎一样。生物网络还具有其他显著的高维属性,譬如组件形成功能网络的自组织性,几乎在生物学所有层次上均起作用的自然选择以及生物学“自我”的定义(即一个组件属于一个网络的一部分还是不属于)。这个高维属性将不在本书中描述。

图2.3:细胞内环境的拥挤状态。一些物理学指标包括,粘度> 100 × μ H 2 O,渗透压< 150 atm,电位梯度≈ 300 000 V/cm 。这些指标近乎等于晶体状态。

2.3 网络的关联边

化学反应将组件关联形成一个网络。尽管我们可以设定生物网络中每一条关联边的化学属性,宏观表型功能实际是由网络多条关联边综合决定的。

大多数生化反应都是双线性的。双线性使得网络具有拓扑非线性的超图特性。这个特性让生化反应网络形成了不同化学属性和部件从一个携带者传递到下一个携带者的环形缠绕结构 [186] 。大家最熟悉的这种转换可能就是代谢物和蛋白质的高能量磷酸键传递过程。三磷酸腺苷(adenosine triphosphate,ATP)是这样的高能键的主要携带者,例如一个磷酸基结合到葡萄糖分子上形成作为糖酵解(glycolysis)反应第一步产物的 6-磷酸葡萄糖。信号传导网络组件通过磷酸化或去磷酸化反应也具有同样特点。其他分子间可以传递的特性包括氧化还原势、一碳单位、二碳单位、氨基等。这使得生化反应网络具有高度交织的特性。

生化网络随着规模扩大会出现一个有趣的特性,因为组合特点导致网络可能的功能状态数目增长速度远快于组件的数目。网络功能状态数目的如此增长,一般会超过组成网络的相对较少的组件数目。因此一个基因组所表征的表型功能数目并不与基因组中基因数目线性相关。例如人类基因组仅仅比一种小型蠕虫秀丽隐杆线虫( Caenorhabditis elegans )多 50%左右的基因,然而人类表现出更加复杂的表型和更大的差异性。所以一般很难将物种的复杂性与这个物种基因组中基因的数目关联起来。

生化网络具有大量可能的功能状态,这一基本属性使得同一个网络可以表征很多功能,由此展示出很多不同的表型行为。一个有机体并没有完全利用所有这些可能的功能状态。很多可能的功能状态在物种生存过程中可能是完全不起作用的。即只有有限个数的功能状态被细胞选择并表达出来。我们已经熟悉对功能状态进行选择的调控机制,目前正在对单细胞生物的复杂转录调控网络和多细胞生物的信号传导网络进行深入研究。在本书第 16章中,我们将描述复杂生物反应网络的等价功能状态,即对网络关联边的不同使用方法来得到完全一样的功能状态。

生物网络具有一些与其他网络显著差异的特性,主要包括系统属性的分析方法。生物网络的第一个基本特性是可进化性,即可以随着时间变化。它们是时序变化的。主要而言,生物网络在任何一个特定时间点的关联边的动力学属性和活性关联边的存在性是不断变化的。关联边的存在性可以通过基因表达、水平基因转移或其他机理来调控。第二个需要考虑的特性就是生物网络的目的性。其最基本的目的就是生存。然而具有多个网络组成的复杂生物,部分网络可以具有生存这个总体目标的子目标。例如,脂肪细胞在周围环境具有足够能量资源时,会收集并存储脂肪。而作为细胞发电厂的线粒体,主要目标是从现有资源中获得最大量ATP。因此生化反应网络的研究成为当前非常相关甚至主要的研究课题。

所以,所有生物组件关联可以形成网络。一个网络可以具有很多功能状态,其中只有一部分被生物实际选用。关联边、网络拓扑和网络目的都可以随着时间或环境因素的改变而改变。一个非常重要的事实是生化反应网络是在非常拥挤的细胞内部活动(见图2.3)。因此生物过程的网络视图必须是三维空间中的网络设置。这种设置条件也限制了像电路芯片网络这样的其他人造网络。

2.4 受限制可行功能状态

上面描述的关联边的特性、形成网络的方式和网络如何产生功能状态等机理,使得全基因组生物系统的计算建模与模拟将与生理生化建模的方式不同。首先就是一个生物网络可以具有很多不同状态,即不同的建模解决方案。哪个功能状态(即解决方案)被选中执行,决定于细胞的实际状态,这些选项是基于细胞在不同时间所经历的选择压力。这些从生理生化科学产生的区别参见图2.4。所有针对工程或物理学科的理论建模考虑都会尝试基于物理和化学定理来计算一个精确解。而在生物学中,一个网络可以根据物种不同的进化历史而从大量不同解决方案中选择一个,同时也可以采用不同但是等价的方式来产生同样的功能。因此生物学中的静默表型(silent phenotype)数学上同义于多个等价的网络状态。这导致了生物学与数学建模理论之间关键规律的有趣差异(如表2.1 所示)。

物理学重视强调提炼理论。定量机理在 100 年前提出,玻尔兹曼(Boltzmann)在那之前就推断出他最著名的公式。采用数学公式表达的理论来描述我们对物理学基本理论的理解,将继续作为物理学的核心基础。如果希望获得这些公式的特定解决方案,我们需要给出边界条件并计算出一个唯一解。

图2.4:理论分析与受限制分析的对比。图示对比了一个精确解(一个点)与一组可行解(一个解空间)的比较

表2.1:建模理论关键规律差异

工程科学与这套原理有所不同。工程科学中使用的公式不需要理论上严格正确,只需要它可以合理描述现实面对的现象和反应过程。而所提供的边界条件是非常重要的,因为这些条件是工程人员所希望设计的实际场景。工程科学习惯于面对满足限制条件的多个解决方案,并进而基于这些设计变量来使最终选择的解决方案更优。

综上所述,我们发现用于描述细胞内环境物理规律的数学公式几乎没有已知的,并且生物网络功能状态还会随着时间而不断变化和进化。因此描述生物学功能的基础公式在现阶段难于提炼总结。从另一个角度来说,描述细胞进化生长的内环境限制条件是明确定义给出的。基于约束的方法来分析复杂的生物系统已被证明是非常有效的(参见本书第三部分)。

◆ 细胞运转的限制条件

细胞在无数限制条件下进行运转。这些限制条件可以采用不同方式进行划分,大量文献已经从不同角度讨论了这些限制条件。下面列举出一些。

●F. Jacob [102] 基于自然选择理论给出了两类最常见的限制条件。它们包括:(i)繁衍下一代的需要,以及使用与父辈不完全一致的遗传信息来繁衍;(ii)持续与外界环境交互来保持物理、能量和信息平衡的热动力学限制条件。后者可以很容易通过物理学基本原理来描述。

●Danchin [41] 在他的经典基因组学书籍中将细胞过程及其限制条件分为四大类:(i)将生物功能按照不同空间位置进行区分,以及区分细胞内和细胞外;(ii)决定了细胞内物质、能量和氧化还原势的代谢反应,及其与细胞外部世界的关联;(iii)将存储的信息转化为生理生化过程(即激活遗传信息);(iv)将存储的遗传信息从一代传递给下一代。

●另一组科学家将用于分析重构生化反应网络功能的限制条件分为以下四类 [176] :(i)生理生化限制条件;(ii)空间及拓扑结构限制条件;(iii)环境限制条件;(iv)调控限制条件。这些数学公式描述的限制条件可以用于评价网络的容量和功能(参见第 12 章)。

将调控作为自身具有的限制条件或者约束条件,支持了在自然选择过程中物种生存过程中观察到的一些现象。

◆ 选择候选状态

细胞必须满足一些不可侵犯的限制条件,譬如质量和能量守恒条件。相关的生化网络必须满足这些以及其他空间相关的限制条件。在网络的所有可行状态中,这些条件被称为硬条件(hard constraint),如图2.5 中五边形所示。细胞会根据自己的进化历史以及当前的生存挑战(譬如当前的主要环境限制条件等)来确定哪几个功能状态是合适的。去除所有不希望具有的功能状态(即不合适或不适应选择压力)的一种方法,就是通过实现一个调控网络来去除解空间(五边形)中一大部分点并表达所希望具有的表型基因。这些内容将在第 12 和 13 章中讨论。

图2.5:网络功能约束说明。五边形说明了基于物理化学和环境约束的功能允许范围。实线说明了由监管网络产生的自我约束(限制);也就是说,线以下所有状态由监管机制排除。点表示所需的功能状态,发现当中的容许状态在监管约束后实施。

一个功能状态或表型不一定是所面对限制条件下的最优方案。这样的解决方案可以在一个允许的范围内有一定变化。这样在一定功能状态选择压力下的变化,可以通过在特定时间调控基因的表达,或对应基因产物的功能来实现。这样的调控通常只在很短时间里发生。当然长期而言,网络中的组件可以进化改变功能,从而导致细胞的表型功能变化。

◆ 生物学中的层次化组织

细胞功能和属性的不同方面按照层次化结构组织如下。图2.6A中展示了DNA的空间组织方式。一个大肠杆菌的基因组线性展开长度约为 1 毫米,而细胞的尺寸以微米为单位,相差 1000 倍。所以细菌的基因组是以层次化结构,呈 1/1000 压缩在细胞中的。生物化学反应网络也可以用类似方式分解描述(如图2.6B所示)。反应有序分组为一个个单元,它们可能是空间上共定位或实际紧邻的。多个这样的有序单元又可以组合成更大的单元等等。

图2.6:细胞中的层次化组织结构。(A)细菌基因组,和(B)网络拓扑结构和功能。图片来源:由Timothy Allen(A)和Jason Papin(B)提供

适用于底层组织的限制条件需要与更高层次上的功能有关联性。这样的限制条件向上兼容,使得生物现象可以采用“自底向上”(bottom-up)的策略来研究。数学上的哥德尔完备性定理又表明,数学公理不能证明一个系统的所有属性都适用于生物学。如果这个是成立的,那么我们就不能仅仅从底层操作来推导出上层功能。因此系统层面观察和分析得到的功能需要用来进一步完善“自底向上”的研究策略。故而“自底向上”和“自顶向下”互为补充,可以综合用来分析复杂生物现象的层次化结构。

图2.7:用细胞过程的出现顺序定义的世界进化历史。图片来源:由Marc Kirschner提供

进化历史中不断获得细胞功能的过程如图2.7 所示。细胞过程的基本生物化学机理,采用DNA分子承载和表达的遗传信息早已进化。这部分基本生物工程仍然可以在绝大多数今天存活的物种中找到。遗传代码几乎适用于所有物种,大多数蛋白质是由大约 20 种氨基酸组成。这些是所有接下来的生物过程所依赖的基本限制条件。这些遗传代码无法从基本理论或者物理学中预测出来 [39] ,但是符合物理学和化学的基本法则。一旦被进化选择,接下来就会在进化过程中所固定。类似地,大多数现代蛋白质是由有限数目特征串(motif)组成,这些形成整个物种设计图中非常保守的基本零部件。因此这些生物层次底层结构的限制条件对上层结构有限制作用,但不能完全解释或预测更复杂的上层结构。进化过程就像一个修补匠,将现有的组件用无法预测的新方法组合起来。图2.7 中的第一波非常接近于化学基本规则,也是本文的主要研究对象。

2.5 总结

◎ 生物系统是由它们的组件之间相互作用所定义。

◎ 分子组件之间的关联边由化学基本法则所限制。

◎ 组件之间的多条关联边形成一个网络,而网络可以有功能状态。

◎ 网络的功能状态由不同因素所限制,包括生理生化、环境和生物学因素等。

◎ 一个网络可能具有的功能状态数目远大于网络中组件的数目。

◎ 一个生物网络的可行功能状态数目也远大于对一个物种有益功能状态的数目。

◎ 细胞通过进行精心设计的调控机制来选择真正有用的功能状态。

2.6 扩展阅读

Danchin, A., THE DELPHIC BOAT: WHAT GENOMES TELL US,Harvard University Press(2003).

Harold, F. M., THE WAY OF THE CELL: MOLECULES, ORGANISMS, AND THE ORDER OF LIFE,Oxford University Press(2001).

Hartwell, L. H., Hopfield, J. J., Leibler, S. & Murray, A. W., “From molecular to modular cell biology,” Nature , 402:C47-C52(1999).

Gerhart, J. & Kirschner, M., CELLS, EMBRYOS, AND EVOLUTION: TOWARD A CELLULAR AND DEVELOPMENTAL UNDERSTANDING OF PHENOTYPIC VARIATION AND EVOLUTIONARY ADAPTABILITY, Blackwell Science Malden(1997).

Jacob, F., “volution and tinkering, ” Science , 196:1161-1166(1997).

Monod, J., CHANCE AND NECESSITY; AN ESSAY ON THE NATURAL PHILOSOPHY OF MODERN BIOLOGY,Knopf, New York(1971).

Nielsen, J., “It is all about metabolic fluxes, ” Journal of Bacteriology , 185:7031-7035(2003).

Papin, J. A., Reed, J. L. & Palsson, B. O., “Hierarchical thinking in network biology: the unbiased modularization of biochemical networks,” Trends in biochemical sciences , 29:641-647(2004). JbeNxVSScOjWvBpTwU5arsXIUZlQoSk4vcmijE3EMfaoR6R/6aog9DPDusXp2XlC

点击中间区域
呼出菜单
上一章
目录
下一章
×