蛋白质(protein)是构成生命的基础物质,是构成细胞的基本有机物,也是生命活动的主要承担者。基因经过选择性转录、翻译、加工修饰等过程,产生参与多种生物过程的蛋白质。蛋白质组学(proteomics)就是对蛋白质功能的大规模系统研究,将极大地帮助我们理解和分析“后基因时代”的基因功能 [1] 。蛋白质组学从整体的角度分析细胞内动态变化的蛋白质组成、表达水平和修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞的生命活动规律。正如DNA技术克隆的简便化给分子生物学带来革新那样,蛋白质组学研究,也使我们对蛋白质的生化过程和作用机制有了更直观、更深入、更系统的认识。
20 世纪 90 年代中期,由于基因组学无法完全满足人们深入了解疾病的需求,科学家提出了“后基因组计划”,蛋白质组学就是其中重要的研究内容。
蛋白质组学最初的提出可以理解为基因组学的延续,1994 年,澳大利亚麦夸里大学的两位科学家威尔金斯(Wilkins)和威廉斯(Williams)在意大利召开的第一次国际蛋白质组学专题研讨会上提出蛋白质组(proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的结合,意为一种基因组全部蛋白质的存在及其活动方式。
蛋白质组学的问世时间虽然很短,但已经在细胞增殖分化、异常转化、肿瘤形成等方面取得了可观的研究成果。蛋白质组的分离研究已经从传统的普通双向凝胶电泳,发展到多维色谱分析。蛋白质组鉴定分析从最早依赖于普通的数据库比对,发展到现在的以质谱技术为核心的一系列检测分析方法,例如毛细管电泳-质谱联用新策略,更可以直接鉴定全蛋白质组混合酶解产物。此外,蛋白质相互作用研究、高通量和高精度的蛋白质相互作用检测技术也得到了迅速发展。高通量技术方面,例如蛋白质芯片和蛋白质组生物信息学,已在蛋白质组研究领域得到广泛应用,使得蛋白质组学进入系统生物学研究模式阶段,并将成为未来生命科学最令人激动的新前沿领域之一。
蛋白质组学的研究内容主要有三个方面:①表达蛋白质组学,主要是研究差异样品间蛋白质表达量的变化,可以鉴定信号转导中的特殊蛋白,以发现药物相关靶点;②结构蛋白质组学,主要是蛋白质表达模型的研究,包括蛋白质氨基酸序列分析及空间结构的解析种类分析和数量确定;③功能蛋白质组学,主要是蛋白质功能模式的研究,包括蛋白质功能及蛋白质之间的相互作用。
蛋白质组学分析为检测基因组表达提供强有力的证据,蛋白质直接负责生物体的功能和表型。正如1992年诺贝尔奖获得者费希尔(Edmond Fischer)所指出的,基因组测序使我们能够预测可能产生的蛋白质,但不能预测在何处、何时或在何种水平上产生。它也没有考虑基因重排、RNA剪接和编辑,以及蛋白质翻译后修饰所产生的巨大多样性。仅仅有DNA序列,我们无法得知蛋白质的生理功能,而蛋白质组学分析为分析细胞中蛋白质的复杂性和多样性提供了一种直接的方法。蛋白质组学告诉我们,基因组的哪个部分是有功能的,在什么水平上发挥作用,给出了基因功能的代谢和发育变化的全面图像,而仅在RNA水平上分析基因表达就忽略了翻译和翻译后调控。因此,蛋白质组学不仅仅是一次科学的技术革新,更为真正理解基因组表达迈出了重要一步。通过对人体不同组织和器官中蛋白质组变异的分子细节研究,我们能更清楚地识别人类生物学和疾病过程中的蛋白调控机制,推动疾病的诊断标志试剂盒和靶向药物的开发,促进精准医学的发展 [2] 。