1995 年,第一个完整基因组测序的完成开启了基因组时代。自那时起,大规模高通量技术的出现,帮助我们确定了细胞成分的分子零件目录。虽然这一目录仍不够完整,但是在现有目录和其他信息的基础上,已经有可能在基因组规模上重建细胞内生化反应网络。这一网络重建的过程,以及随后使用计算机模型来描述其功能,是系统生物学的核心内容。
重建网络的功能,由该网络组分之间的相互连接来决定。由于这些连接包含化学反应,因此可用化学计量关系来描述它们。包含所有网络关系的化学计量关系矩阵,是该重建网络的简明数学表述。化学计量关系矩阵包含的整数,用来表示网络中恒定的时间和条件性质。因此,该矩阵是复杂生化反应网络功能研究的关键,其内容和相关信息有效构建了生化、遗传和基因组的结构化数据库。
本书着重讨论化学计量学矩阵。为了更好理解本书,读者需具备良好的线性代数和生物化学基础。本书中大多数数学概念和原理均有直接的生物学和化学意义,我们试图将抽象的数学量与真实的生物和化学特性联系起来。
不管你是否喜欢,基因组规模反应网络的重建将逐步把生物学推进到系统科学领域。这不是普通的系统科学,而是系统生物学和生物工程,深层的生化和遗传过程为其搭建了舞台。未来的生物学教育无疑会涉及更多的数学知识,因而新一代的生物学家应该乐意学习了解本书。
这是一本极具个人特色的书。笔者在复杂生化反应网络的数学表述领域有超过 20 年研究经验。在刚开始从事该研究时,人们普遍认为这种做法是纯粹理论研究,没有实际生物学意义。然而,随着基因组时代的到来,我们已拥有了必要的生物学数据,用来构建真实基因组规模的网络,并能将其性质与可观测到的生物学表型联系起来。在过去 5 到 10 年间,这一领域取得了长足发展,并已变得相当有影响。从某种意义上来说,本书不仅仅是由笔者撰写的,也是为笔者所撰写的。在本书中,笔者尝试梳理这一研究领域,并整理这一领域包含的概念、成果以及未来的发展潜力。希望本书能为他人提供帮助。
笔者要感谢很多对本书提供过帮助的人。最为感谢的是笔者的妻子Mahshid,她容忍并接受了笔者将大量时间投入到本书的构思、撰写和付梓过程中。没有她过去 20 年来的耐心和支持,本书将不可能出版。
有三个人影响了我的职业生涯,从而促成了本书的撰写。作为一名大学生,我曾在Sigmundur Gudbjarnason的生化实验室工作,在那里我体会到了酶的神奇,学习了酶类的纯化和动力学特征。在对实验室数据的分析过程中,我意识到酶是有趣的催化剂,成百上千的酶聚集在一起,重现了有趣的生命过程。我所以选择了化学工程作为自己的研究领域,是因为化学工程是唯一可供我学习生命、化学与系统科学的学科。我有幸加入Edwin Lightfoot的实验室攻读博士学位。虽然他并没有做过太多分子生物学方面的系统分析,但是他立即意识到它的重要性,并愿意支持我在攻读博士学位期间从事这样的分析工作。毋庸置疑在 20 世纪 80 年代初,生物学的系统分析被视为一个“死胡同职业”和“自杀式的专业”。从教密歇根大学后,我被迫从事其他更可能获得资助的研究方向。在 90 年代初,我开始意识到Lee Hood通过发展高通量研究方法给生物学带来的革命性影响。他的远见和领导才能给我带来灵感,并最终成为我的好朋友。我很感谢这三个人对我职业生涯发展和对本书成文所产生的积极影响。
从密歇根大学换到加州大学圣地亚哥分校后,我有幸在 1996 年春季到丹麦技术大学访问,并得到了Jens Neilsen和John Villadsen的接待。在由Fulbright和IbHeinriksen基金会赞助的四个月访问中,我认真思考了第一个完整的基因组序列会带来的影响,并因此建立了本书的一些概念性基础。2000 年,我被任命为威斯康星大学Hougen客座教授。并为此在那年秋天准备了Hougen系列讲座。这一系列讲座的讲义成为了本书内容的最初轮廓。
Whitaker基金会慷慨地通过教材计划支持了本书的编写。由于人员支持的缺乏和对教师工作时间日益增长的需求,在今天的学术环境下,对于教授们来说编写教科书是非常困难的。如果没有Whitaker基金会的支持,本书将无法完成。
Marc Abrams负责了本书的技术协调。他拍摄了大部分的资料(文字、插图和参考文献),并转为LATEX文件用于出版。他还准备了很多插图的原型。他在本书写作过程中的耐心、坚持和毅力值得赞赏。
非常幸运的是在加州大学圣地亚哥分校工作期间,我有很多出色的学生。特别要感谢他们中的很多人对本书多个章节提供的帮助:Scott Becker,第 7 章和附录二;Natalie Duarte,第 3 章;Iman Famili,第 3、6、8、10 和 14 章;Adam Feist,第 15 章及附录二;Markus Herrgard,第 4 和 16 章;Andrew Joyce,第 4 章;Jason Papin,第 5、9 和 13 章;Nathan Price,第 9 和 14 章;Jennifer Reed,第 3、15、16 章和附录二;Ines Thiele,第 13 章。也要感谢Henry Kang的协助编辑。
我的另外四个学生也影响了本书中部分内容:Joanne Savinell在 80 年代后期撰写了关于化学计量网络的第一个综合博士论文;Amit Varma在 20 世纪 90 年代初建立了大肠杆菌生化综合模型;在 90 年代末,Jeremy Edwards通过建立第一个基因组规模代谢模型,成为事实上第一个“高通量计算生物学家”;在 90 年代后期,Christophe Schilling开发了极限通路,并认为基因组规模网络改造和模型建立需要具备商业化优势的软件和服务。根据这一思想,他创立了Genomatica公司,我是该公司的共同创始人。与本书相关的课后作业和重建网络将在http://systemsbiology.ucsd.edu公布。
在过去几年间有好几本书对我的想法产生了影响。Daniel Atkinson的《细胞的能量代谢及其调控》(CELLULAR ENERGY METABOLISM AND ITS REGULATION,1977)是我第一次从系统和工程的角度接触到新陈代谢分析,它影响了我的早期职业生涯。Jens Reich和Evgeni Selkow编著的《细胞能量代谢》(ENERGY METABOLISM OF THE CELL,1981)对我早期的想法产生了深远的影响。这本书概念丰富,是定量系统分析生化反应网络的开拓性工作。Antoine Danchin的《德尔菲之船》(THE DELPHIC BOAT,2003)对基因组及其内涵进行了娴熟的生物学分析。Ernst Mayr的许多著作,例如《这是生物学》(THIS IS BIOLOGY,1997)提供了他数十年来关于生物学和理化科学之间根本差异的有益思考。这一差异也是现在系统生物学试图去弥补的间隙。
许多人都直接或间接地(主动或非主动地)影响了本书的内容。他们包括:Adam Arkin,Laszlo Barabasi,Dan Beard,Sydney Brenner,Antony Burgard,George Church,Frank Doyle,John Doyle,David Fell,David Galas,Igor Goryanin,Vassily Hatzimanikatis,David Haussler,Leland Hartwell,Reinhard Heinrich,Jay Keasling,Marc Kirschner,Hioraki Kitano,Stefan Klamt,Choul Gyun Lee,Sang Yup Lee,William Loomis,Costas Maranas,Harley McAdams,Terry Papoutsakis,Uwe Sauer,Mick Savage,Michael Savageau,Stefan Schuster,Daniel Segr’e,Lucy Shapiro,Jurg Stelling,Gilbert Strang,Shankar Subramaniam以及Masaru Tomita。非常感谢这些同事多年来充满启发的讨论。
笔者希望这本书能成为规范系统生物学课程和教材的开始,从组分到网络到模型到计算表型均应包含在该规范中。
2005 年 5 月