细胞的生化反应在时空上精密地组织,相互作用形成了复杂网络。这些生化反应网络产生了可观察的细胞功能。网络重构的目的是寻找组成网络的所有生化反应。目前已经构建了一些物种的代谢网络。本章将介绍代谢网络重构的主要特点。简单介绍代谢网络的基本特征以及利用分层思想解读复杂网络的功能。更多细节请参考权威文献[120,218]。
在本章的最后一部分将介绍在全基因组范围上代谢网络及其相关的多个网络的融合。多个网络的融合将帮助全面理解细胞功能。迄今为止,尚未构建如此全面的网络。本章关注代谢网络,在接下来的两章将分别介绍转录调控网络以及信号传导网络。
中间代谢也称为细胞内代谢,被视为生物体内的化学“引擎”。在中间代谢过程中,生物体借助于多种反应从营养素或消化产物中获取能量及机体构成所需“原材料”,从而维持细胞生长,保证细胞功能顺利实施。该生化“引擎”呈高度动态运作,且遵循一定的物理和化学定律,从而受到了多种理化因素的限制。同时,它具有一个复杂的调控机制,使得机体能够有效应对外部因素干扰。许多人类疾病与代谢不平衡有关,例如糖尿病、肥胖症、癌症和心脏病。
代谢具有两种化学形式:分解代谢和合成代谢。分解代谢通路把各种底物分解为代谢物;合成代谢通路用于合成实现细胞功能所需的氨基酸、脂肪酸、核酸等物质。在代谢过程中,通过载体分子实现了化学基团及氧化还原电位的交换(见表3.1)。载体分子以及物质交换的媒介物质将数以千计的代谢反应紧紧联系在一起形成了代谢网络。图3.1 表示中间代谢在多个复杂性层次上的示意图。
表3.1:代谢过程中重要的化学基团以及它们的载体
全基因组范围的代谢网络涉及数百种代谢物和上千个生化反应(见表3.6)。代谢网络的功能难以在直观上被人们所理解,需要借助于数学模型研究对其功能和性质进行模拟。正如 1.2 节所介绍,以层次方式研究网络,有助于理解网络功能。网络层级结构的划分可以基于人们的理解,也可以基于对化学计量矩阵的无偏数学分析(见第 9 章)。接下来,将简单介绍传统的代谢网络功能层次分解(见图3.1)。
第一层:细胞的输入和输出。中间代谢包含一系列酶促反应,将底物转化为大分子的组件以及细胞生长和维持所需的其他重要物质。本层次对代谢过程的描述是一种粗粒度描述:将底物作为输入,将生成物质及代谢副产物作为输出。多数情况下,细胞层次上的代谢网络描述足够应用于发酵工业生产 [6, 198] 。该描述包含一组配对的物质、能量平衡以及各种经验所得的产率系数,产率系数描述了所消耗底物的比例。生长动力学可以由一些简单的模型来模拟,例如,Monod方程。然而,此类模型仅适用于特定条件,且产率系数不是常数,会随着细胞状态的改变而改变。
图3.1:代谢的四层功能分解。第一层:全细胞;第二层:新陈代谢部门;第三层:通路;第四层:单个化学反应。
第二层:部门。如以较细粒度研究中间代谢,它可以分为两类(每类视为一个部门):分解代谢与合成代谢(见图3.2)。分解代谢通过一系列趋同的通路将底物降解为 11 个重要代谢物(也称为前体)。合成代谢通过一系列趋异的通路将前体或构件分子合成生物大分子。例如,用于生物工艺的遗传工程细菌适于在本层进行研究,因为它们适于评价宿主—质粒间的相互作用关系。
图3.2:细胞代谢的重要组成部分。图片来源:参考文献[4]
第三层:通路。更好的解析度在某些通路的情况下,部分扮演了一个可确定的角色。例如,大部分生物分子的分解代谢具有相同的模式,即细胞获取底物;若有必要,先被辅助因子激活,将底物水解,然后被降解为能量或者其他物质存储于载体分子。请注意,在该层次描述上,代谢基本特征将受到基本化学原理的影响,例如化学结构和动力学调控。代谢库(如能荷)及调控酶影响着物质和能量的分布。在现阶段,基于通路层次研究生化反应网络已得到了学者的广泛关注。
第四层:单个反应。本层关注发生在细胞内部的所有生化反应,这是从最细粒度研究中间代谢。利用第 1 章所介绍的高通量数据,可获取细胞内部的生化反应信息。本书关注生化反应层次上的代谢过程。利用生化反应信息,构建全基因组范围的化学计量矩阵,并对其进行分析。由于化学计量矩阵的维度通常较大,有时会有数百代谢物和上千化学反应,所以构建功能完善的代谢网络的复杂度将会很大。
转氨作用、磷酸化作用、异构化作用、歧化反应等是几种常见的生化反应。生化反应的类型决定了代谢网络中边的类型。如后面所述,生物化学家已经设计命名法,根据这些转换类型进行分类。一个酶学委员会编号(E.C.)与每个酶催化的代谢反应相关联。另外,每个生化反应还有一些热力学限制条件,用这些限制条件可以控制反应的可行性及平衡态。尽管代谢网络很复杂,但是代谢网络的拓扑结构及网络状态还是受到基本物理化学的约束,从而可以进行分析。这些约束条件将在本书的第二、三部分进行详细介绍。
一个基因组范围的代谢网络的重构,依赖于网络中所有生化反应的各种信息源的集合。大量的数据源可以被用来合成一系列的化学反应,从而构建有机体的代谢网络(见图3.3)。下面将介绍四种主要的数据资源(按数据可靠性排序)。
1.生物化学。强有力的证据表明,如果一种酶直接从生物体中分离,其功能已经表现出来,从而就发现了一个代谢反应的存在。大量的数据适用于典型生物,如大肠杆菌和酵母。
2.基因组学。基于DNA同源性序列的开放读码框(ORF)的同源序列,可作为生物体内反应存在的有力证据。此外,实现功能注释的途径还包括以下两种:研究开放读码框的基因位点以及研究与该基因相邻的基因簇。基因组注释信息在不断修正与更新中。
3.生理学和间接信息。生理学证明,如已知的细胞在体内具有产生氨基酸的能力,可导致包括“填满通路”以产生氨基酸的反应。这个过程被称为间隙分析。其他生理信息往往在诊断重构网络的功能时非常有用。
4.生物信息学建模数据。代谢网络的建模和仿真经常会推断出代谢网络中可能包含的某些代谢反应。原则上,利用计算机仿真的代谢网络应符合细胞的真实行为。例如,代谢网络必须能够产生所有细胞生存必需的代谢成分。如果缺失某些代谢成分,则要加入相应的反应。这种反应称为“推断的反应”。
图3.3:构建全基因组范围上代谢网络的总流程。图片来源:参考文献[37]
所有被各种方法确认的反应,结合产生了感兴趣的生物体在基因组范围的代谢重构。通常情况下,重建过程中开始于已注释的DNA序列。重建是“基因组范围”的,因为它会包含所有在该生物体新陈代谢时基因组中找到的信息。这组反应包括结合定量分析法的基因组规模代谢模型,这让我们能够分析、解释和预测集成网络的功能(见图3.3)。在文章后面会提到一些根据基因组规模网络量身定制的数学方法。
显然,各种来源的置信水平不同,但可以用定量尺度来对来源的可靠性进行排序。一种方案是使用生物化学数据(4),基因数据(3),基因组数据(2),生理数据(1),和建模数据(0) [191] 。另一种方案是在不完全确定反应存在的情况下,直接获取的生物化学数据,尽管特定标准的序列同源性被认为是正确功能分配的一种有效的证据。
由于很少生物有大量可用的生物化学信息,重建在很大程度上依赖于一个带注释的基因序列。开放读码框在基因序列上可以被识别,所以它们被分配功能。通过实验(基因复制和表达或基因敲除)或者与其他物种已知功能的基因进行序列同源性比对,对开放读码框进行功能注释。对于新测序的物种,生物信息学的预测大约可以识别 40%—70%的开放读码框。此外,还有更多新方法用于基因组功能注释。例如,通过蛋白质与蛋白质间的相互作用关系、转录、系统发生谱、蛋白质融合、操纵子聚类等信息推断基因产物的功能(表3.2)。请注意,生物信息学所注释的基因功能通常基于假设,这些注释信息在相应的基因产物的功能被直接证实前可以被修正。带注释序列的网络重构的自动化已经被应用 [108] 。为了让重构效果更好、更精确,必须手动验证所有组件和网络的链接。因为相关生物之间常常存在细微的差别。许多网络资源可用于分辨差别的目的(表3.3)。
表3.2:基因组注释方法 [108,148]
众多公共数据库提供了基因组序列数据(表3.3)。综合微生物资源网站(CMR,Comprehensive Microbial Resource)提供了分析 63 个注释基因组序列的工具。基因组研究所(TIGR,The Institute for Genomic Research)负责更新和维护CMR网站。
表3.3:基因组公共数据库由Ines Thiele提供
续表
续表
另一个包含了许多微生物基因组的数据库是Genomes On-Line Database(GOLD)。并非所有的网站上的信息都是公开的。GOLD的开发人员在自动重构代谢网络上运用了通路模板。
生化数据是推断代谢反应是否存在的最可靠的信息。生化数据不仅给出了化学计量,而且给出了反应是否可逆。例如,葡萄糖激酶能够催化右旋糖转化为D-葡萄糖-6 磷酸钠盐(ATP转化为ADP)。编码该激酶的基因是glk,且生化反应的E.C.编号为 2.7.1.2。人类β-细胞葡萄糖激酶的结构见图3.5。近年来,常有文章、专辑综述某物种代谢过程的生化数据。
图3.4:代谢网络。该图表示酵母代谢网络。资料来源:http://systemsbiology.ucsd.edu
图3.5:葡萄糖激酶的化学反应及其蛋白质结构示意图。资料来源:http://www.rcsb.org/pdb
E.C.编号用于系统性表征酶的反应(http://www.chem.qmul.ac.uk/iubmb/enzyme/)。它们已经被建立成明确分类的反应。这是必要的,因为在生物体中,许多酶具有含糊和重复的名字(见表3.4)。
表3.4:部分酶的国际系统分类编号
例如,进入E.C.网站后,首先搜索琥珀酸脱氢酶(sdh),接着搜索富马酸还原酶(fr)。以上两种酶催化了同一反应的相反方向。研究发现,琥珀酸脱氢酶或者富马酸还原酶在某些条件下可逆。因此,当输入琥珀酸脱氢酶时,可得到两个反应。Busch研究团队提出了一种类似于E.C.系统的分类机制用于分类转录反应 [26] 。然而,尚未有类似于E.C.系统的分类机制用于基因分类。因此,基于基因组注释信息构建代谢网络是非常耗时耗力的工作。
Swiss-Prot蛋白质数据库(http://us.expasy.org/sprot/)是目前最为完备的蛋白注释数据库,其中每条蛋白质的序列信息及其注释信息都是经过人工校验的,被视为生化信息的“金标准”。该数据库包含了文献、序列、功能注释以及其他有用信息。若不确定机体中某蛋白是否表达,但是在Swiss-Prot蛋白质数据库中查到了该蛋白质表达的信息,则可以确定该蛋白已被研究并且可以获取来源文献。TrEMBL是基于生物信息学算法及自动化信息挖掘工具对蛋白进行电子注释的蛋白质序列数据库,是Swiss-Prot的外围辅助数据库。TrEMBL收录来源于研究文献报导的但还未被注释整合到Swiss-Prot的蛋白序列数据。
值得注意的是,并非所有基因与其相关的酶或代谢反应间存在一一对应的关系。多个基因可能编码催化同一代谢反应的酶的亚基。例如,富马酸还原酶具有四个亚基,分别为frdA、frdB、frdC和frdD。若其中任意一个亚基不表达,则富马酸还原酶便不能催化反应。反过来,多个基因编码“混杂酶”。“混杂酶”能够催化多种代谢反应,例如戊糖磷酸途径中的酮糖移转酶。以上例子说明研究基因、蛋白质以及代谢反应之间的联系具有重要意义。图3.6展示了基因—蛋白质—代谢反应间多种关系,其中第一层是基因位点,第二层是肽链,第三层是蛋白质,第四层是代谢反应。
图3.6:基因—蛋白质—代谢反应间的关系。图片来源:参考文献[185]
多个基因可能编码一个蛋白质的亚基,多个蛋白质可能形成一个蛋白质复合体。亚基(例如sdhABCD和gapC 1C2 )以及酶复合体(例如xylFGH)与代谢反应通过“&”连接,表示只有当所有亚基或者酶复合体均表达时代谢反应才发生。对于亚基sdhABCD来说,符号“&”出现在酶的上一层,表示所有基因产物对于功能酶都是必需的。对于酶复合体xylFGH来说,符号“&”出现在代谢反应的上一层,说明多个蛋白质形成复合体,从而催化反应。琥珀酸脱氢酶可以催化多个代谢反应。同工酶(例如GapC和GapA)是能够催化同一个代谢反应的两个不同的蛋白质。只要有其中一个同工酶表达,则代谢反应发生。同工酶用从不同的(两个或多个)蛋白质出发(箭头始于蛋白质),作用于同一个代谢反应(箭头指向代谢反应)的箭头表示。
一些生物数据库整合了特定生物体的基因组及生化数据信息。例如,大肠杆菌数据库(EcoCyc),综合酵母基因组数据库(CYGD),酵母蛋白质数据库(YPD),酵母基因组数据库(SGD)。
广泛使用的京都基因和基因组百科全书(KEGG)数据库归纳了其反应网络的基因信息图。在反应图中,箭头用于连接各种代谢物,代表一种代谢物可以通过化学反应转化为另一种代谢物。这是用反应和通路数据的标准图形来表示的,在第 6 章中会描述。
一些综合手册详细描述了特定生物的代谢过程及生物功能。这些手册提供了特定生物的代谢特征、重要参考文献以及生理数据。例如,《大肠杆菌》(上、下册) [142] ,该书已经成为研究其他细菌的重要参考书目。随后,其他物种的手册也陆续出版 [131,138,142,211] 。
由于综述文献针对性地描述了特定物种的主要研究进展,对于构建高质量的代谢网络很有帮助。综述文献中通常会提供生化信息的来源。尽管这样,为了不断完善网络,仍需定期搜索相关文献。
重建完整的全基因组范围的代谢网络还需要考虑以下两点:
首先,需要考虑生物体的生存需求。一般情况下,代谢网络应能完成这些功能,比如合成生物体在某一生存条件下所必需的生物物质。有时,如果通过直接实验不能得到,则可以用与之相近生物体的生物物质来代替。例如,在幽门螺旋杆菌或是流感嗜血杆菌代谢网络的重建过程中,假设以上两种菌的生物物质与大肠杆菌类似。然而,类似的假设在真核生物中可能不成立,例如,酿酒酵母。最好是通过实验确定生物有机体的组分。了解大分子的组成信息,例如蛋白质的氨基酸组成 [233] ,比了解大分子的详细构成更为重要。
其次,重建的网络应能够产生实验上观察到的生理现象,因此获取生理数据是非常重要的。这种测试需要集成或网络的数学描述,后面的文字会详细说明。生理数据事实上可以表明网络的功能状态。重建必须能够再现这些观察状态。
单个反应相关的数据以及功能状态相关的数据代表两类本质不同的信息。前者是组分类型的信息,通常称为自下而上的数据。后者是网络类型的信息,通常被称为自上而下的数据。因为代谢网络具有功能层次性,上述两种类型的信息对于重建完整的全基因组范围的代谢网络都是十分重要的。
尽管重建代谢网络已整合了大量数据信息,但网络中的节点与边仍然不可避免有遗漏。通过研究,经常会发现代谢网络中遗漏了一些酶。例如,KEGG和TIGR都表明幽门螺旋杆菌(Helicobacter pylori)中缺乏磷酸果糖激酶。这可能意味着,幽门螺旋杆菌不能从葡萄糖中产生 1, 6-果糖二磷酸(FDP),虽然有可能通过该FDP产生其他通路。文章表明,所述磷酸酶可能已经被鉴定 [90] 。然而,有些学者怀疑磷酸果糖激酶是否真的存在。我们需要全面查阅幽门螺旋杆菌代谢有关文献,然后决定重构网络中是否包含磷酸果糖激酶以及该酶催化的反应。因此,生化数据对于调整和扩大网络是非常重要的。
如今,任何一个生物的特征都不能够被完全地描述出来。因此,尽管在线数据库和所有相关的文献可被搜索或列成表,但在重建中,一些必要反应丢失的概率仍然很高。在基因组中,不是所有的开放读码框都能够被辨别、分配功能,并在网络中链接反应。基于器官的生长和功能,通过去除基因后观察生物体功能是否缺失,能够推断出该基因产物是否出现。“填补间隙”这种方式,相当于陈述假设,可以进一步推动实验研究。
事实上,基于约束的基因组规模网络模型的主要结果,是一个定义良好的表,这个表包含假设和实验,目的是为了协调重建时所产生的差异、填补空白和探索生物的新功能。现阶段已有越来越多的模型用于假设驱使下的实验研究。从具有明显特征的生物,例如大肠杆菌 [51,185,33] 和酵母 [67,47] ,到并未得到充分研究的生物,例如硫还原地杆菌 [127] 。这一过程的迭代模型有望加速生物发现、产品开发和过程设计。它代表了系统生物学研究的主要目标之一 [100,152] 。
自 20 世纪 30 年代糖酵解通路被描述时,以生物化学信息为基础的代谢反应网络的重建就一直在进行。从那时起,大量的代谢反应已被发现和描述。这些化学反应构成了生物化学教科书的大部分内容 [120,108] 。80 年代后期,大型有机体的特定集合开始出现在多个作者的卷册中 [142] 。这些信息开始用于系统合成特定的代谢网络。大肠杆菌代谢逐步大规模重建(见表3.5),并对数学描述的网络属性进行了评估 [183] 。类似地,以生物化学为基础的重建还包括酿酒酵母代谢网络 [54,57] 和黑曲酶代谢网络 [43] 。
表3.5:在前基因组时代,大肠杆菌代谢网络的重建 [183]
1995 年,流感嗜血杆菌实现了全基因组测序 [60] 。它是最早实现全基因组测序的物种。1999 年,在全基因组范围上,首次实现了流感嗜血杆菌代谢网络的重构工作 [50] 。随后,构建多个其他物种在全基因组范围上的代谢网络(见表3.6)。现阶段,尽管已出现了全基因组范围上的真核生物代谢网络,但是大多数代谢网络都是针对细菌构建。构建真核生物的代谢网络相对于细菌更为复杂。通常对于真核生物,要将各个主要细胞器例如线粒体、过氧化物酶体等细胞器作为单独分室进行处理。例如,酿酒酵母代谢网络的重建就涉及到七个细胞器 [47] 。
表3.6:全基因组范围上微生物代谢网络的构建。详细的模型内容存在于http://systemsbiology.ucsd.edu人类心肌细胞代谢网络包含了 230 种代谢物和 189 个反应 [238] ,由Jennifer Reed制作
在最后一节所描述的过程中,可以从这些重构中吸取经验。重构的过程是迭代的。不像基因测序的项目有着各自明确的目标,重构过程一直在进行中。对大肠杆菌网络重构的历史,如图3.7 所示。在这本书出版前,关于这种生物的重构已经持续了近 15 年。最近,其他测序的生物重构进展得更快,现在大肠杆菌代谢网络的全面重构是可以使用的。
图3.7:重构大肠杆菌代谢网络的历史。图片来源:参考文献[183]
代谢网络并非孤立运作。通常,它们与细胞内其他生物过程相联系,例如转录调控和细胞移动。在多细胞生物中,当执行细胞命运(例如分裂、凋亡等)功能时,信号网络常与代谢网络间存在相互作用关系。为了充分描述一个细胞,所有这些网络需要重建和集成,同时代表所有的细胞功能。今天,这种整合仅仅只实现了代谢和转录调控 [33] 。如先前所述,基因组规模代谢的重建在目前比较全面。有丝分裂和细胞凋亡的模型已经出现 [223, 224, 68] 。接下来的两章会描述转录调控和信号网络的重建。
历史上,生物科学将细胞网络划分为代谢网络、调控网络和信号网络。然而,越来越多的研究发现,同一分子参与至少两种网络(见表3.7)。因此,要重建一个全基因组范围上的网络,我们必须考虑基因组和基因产物的所有化学反应。
表3.7:多个网络中的细胞组分(信号网络、代谢网络、调控网络),来源:参考文献[157]
在未来十多年,有望整合这些网络。就像在过去的研究中一样,这种整合有望在大肠杆菌为代表的模式生物上首先实现(见图3.8)。从更宽泛的角度来看,基因组模型的重构提供了一种将所有可用的“组学”数据整合的形式主义;或者“将内容放入上下文”。基因组、转录组、蛋白质组和代谢组数据都整合在一个生化和基因的准确框架,并考虑到其营养环境,可以让人们对整个生物体的功能进行预测。
图3.8:利用多种类型的数据构建大肠杆菌代谢网络。图片来源:参考文献[183]
值得注意的是,化学组分数据(基因组、转录组、蛋白质组、代谢组)和组分间相互作用数据(基因—蛋白质,蛋白质—蛋白质间相互作用关系)能够对应于表型数据(网络功能状态,例如通量组学和生长率表型)。因为数学模型具有可预测特征,因此它能够综合利用计算机模拟结果与实验结果检验高通量数据的准确性。重建网络可以被称作是生化、遗传、基因组结构数据库,而数学分析方法则被称为查询方法。
构建与整合多个网络需要同时接纳多种类型的数据。基因组数据、生化数据、大分子数据以及生理数据被用于重建网络(见表3.8)。
表3.8:全基因组范围多网络融合所需数据类型
●基因组数据包括基因序列、基因位点以及基因功能注释信息。转录调控模型也会用到RNA聚合酶和转录因子绑定的内含子区域的信息。
●重建代谢网络的过程利用了丰富的生化数据,分别考虑了化合物的 L 构型和 D 构型。分子电荷可以通过酸度系数( pK a 值)以及质子平衡式计算得到。所有的反应必须满足元素和电荷平衡。酶的混杂性和不同酶催化相同反应的能力,都需要被考虑到。
●转录、翻译过程重建包括开放阅读框和转录之间的关系。翻译过程不仅仅把转录因子与蛋白质相联系,而且整合了转录因子的半衰期数据、转运RNA丰度值以及核糖体相关数据。转录过程中,不稳定的碱基对与相应的转运RNA相联系。此外,还整合了多个蛋白质组装形成功能蛋白质复合体的数据。
●大规模代谢网络的重构工作使得模拟和调整表型数据成为可能。通量组数据给出了有关网络中的实际通量分布信息,并可以从数学模型中导出。除去基因后的结果也能够被评估。可以分析删除某基因后对整个代谢网络的影响。蛋白质的细胞定位可以被描述,如酵母的七隔室模型。
全基因组范围代谢网络的重建提供了整合大规模数据的框架。代谢反应的重构过程及其化学计量表示是系统生物学中不可缺少的部分(见图1.4)。
代谢的调节是通过调节酶的反应速率来完成的。这种机制是通过调节其活性或关键酶的浓度来实现的;某些情况下,酶的运动功能和浓度都得到调节。这两种类型的调节如图3.9 所示。在反馈回路中,路径终点调节序列中的第一个反应,同时也控制了路径中酶催化反应的速率。调控具有以下两种类型:
(1)负调控,即抑制(repression)基因表达或者抑制(inhibition)酶的活性;
(2)正调控,即促进(induction)基因表达或者激活(activation)酶的活性。
代谢网络存在着不同时间尺度上的调控,如酶活性的快速调控,基因表达的迟缓调控等。这些过程的时间尺度差别可以很大,调节酶活性与调控基因表达分别以分钟和小时为尺度进行度量 [75] 。通常,基因表达调控被认为是代谢的粗粒度调控,酶活性的调控被认为是代谢的细粒度调控。细菌中的基因表达调控已经得到较好研究,但更多复杂模式在真核细胞中被发现。文献[84]详细介绍了代谢调控的基本原则。转录表达调控将在本书的下一章进行介绍,在此简单介绍基因产物活性的调控。
图3.9:代谢调控与转录翻译调控之间的关系示意图。虚线表示调控关系,实线箭头表示主要的化学转换。点虚线用于分隔代谢区域与转录调控区域。图片来源:参考文献[151]
细胞利用多种机制调控酶的活性。例如,代谢过程中,许多关键酶受到附合效应的影响。附合酶除了具有用于底层的结合位点,还具有调节分子的结合位点。调节分子可以激活或抑制酶的活性。催化和调节位点之间附合的相互作用导致酶分子中的构象发生变化。附合(allosteric)一词在文献[139]中提出,表示不同(allo-)的结合位点,而对应的同配(isosteric)表示相同的结合位点。附合效应非常重要,因为底物和调控因子通常是化学不相关的。
附合酶在序列的首端比较常见,而它们的调节可以在序列末尾处找到。这就形成了反馈环路,如图3.9 所示。己糖激酶,该酶催化葡萄糖磷酸化的过程就是一个熟悉的例子。它是由化学能量源的ATP抑制的,这是糖酵解的一个初级产物;同时,也由ADP刺激,这是由储存在ATP中的能量消耗所生产的,它可以被认为是基底。附合调节和其他调节机制都有一个基本的化学机理,因此可以按化学计量来描述,例如蛋白质的磷酸化。
◎ 细胞内部的复杂网络执行复杂的生物功能。例如,代谢网络、调控网络和信号网络。
◎ 所有网络都建立在基础生化反应上,因此可以用化学计量矩阵描述。
◎ 反应网络可以在不同粒度水平上进行描述,从而能够以层次结构方式理解其功能。
◎ 就代谢过程中的生物化学、动力学和热力学而言,代谢网络是研究最充分的生化反应网络。
◎ 对于已测序的物种,重建全基因组范围上的代谢网络已成为可能。
◎ 重建代谢网络是一项复杂的、耗时耗力的工作,需要仔细核实网络中组分以及组分间的联系。现已发展了重建代谢网络的程序。有丰富的网络资源和工具帮助人们重建高质量的代谢网络。
◎ 代谢网络与细胞内其他生物过程相联系。通过重建这些生物过程和整合多个网络,最终将给出细胞功能的全面描述。
◎ 多网络重建表示了生化的、基因和基因组的结构数据库,为分析组学数据提供了框架。
Covert, M.W., Schilling, C.H., Famili, I., Edwards, J.S., Goryanin, I.I., Selkov, E., and Palsson, B.O., “Metabolic modeling of microbial stains in silico, ” Trends in Biochemical Sciences , 26:179-186(2001).
Lehninger, A.L., PRINCIPLES OF BIOCHEMISTRY, Worth Publishers, New York(1993).
Palsson, B.O., “In silico Biology through‘Omics’, ” Nature Biotechnology , 20:649(2002).
Reed, J.L., and Palsson, B.O., “Thirteen years of building constraints-based in silico models of Escherichia coli, ” Journal of Bacteriology , 185:2692-2699(2003).
Stryer, L., BIOCHEMISTRY, W.H. Freeman, New York(1997).