由于科学与技术的成果被一小部分人滥用,科学与技术的副作用开始显现。我们不禁反思,科学的动机和目的究竟是什么,是否能造福人类?人们开展科学研究的效率究竟如何?科学研究是否可以做得更好?在人们反思的过程中,新的科学诞生了,它叫元科学,即使用科学方法来研究科学本身。
元科学是研究科学过程的科学,包括科学的历史和科学哲学等。什么是科学?什么是科学过程?什么样的实践和原则支配着科学探索?在这一章中,我们主要介绍与元科学相关的一些知识和它的潜在应用。
科学的科学,又叫元科学。元科学亦称“元理论”,是以科学为研究对象,研究科学的性质、特征、形成和发展规律的科学。“元科学”概念最先由逻辑实证主义学派提出。这一学派不把科学哲学当作关于客观世界的知识体系,而把它作为研究科学的本质及科学研究方法的“元科学”。
元科学是研究科学过程的科学。它包括科学的起源、科学的本质、科学的历史、科学的方法、科学的优势和科学的局限等。
元科学——在其所有跨学科领域——本身正迅速成为一门新学科。2019年元科学研讨会是元科学或“科学的科学”的形成会议。支撑元科学的跨学科维度体现在广泛的元研究主题中,从非常实用的问题到深刻的基础性问题都包含在内。在实践层面上,所谓的“重复性危机”已经引起了人们对实验室科学日常操作,以及这些操作为何出错和如何改进的关注。在基础层面上,科学形而上学中长期存在的问题仍未解决,例如科学真理和科学客观性如何成为可能。越来越多的来自不同学科的多种方法有助于加速元科学在21世纪作为一个完全整合的研究领域的出现。
推动元科学作为一个完全整合的研究领域出现的研究问题众多,如图3.1所示,主要包括:科学家如何产生想法?科学家如何解释和处理证据?科学的极限是什么?科学重复性的极限又是什么?什么是科学的文化和规范?科学与伪科学的界限在哪里?是什么使科学真理和科学客观性成为可能?科学代理人在科学发现过程中的确切作用是什么?人类价值观在科学方法的实施中扮演什么角色?与科学的实践极限相比,科学的基本极限是什么?探索性研究和验证性研究之间的区别是否重要?科学描述的现实是绝对的还是依赖于模型的?科学的基础是固定的还是可以在未来修改的?元科学的新进展能否克服现有限制?科学解释的未来是什么?
图3.1 推动元科学发展的主要研究问题
资料来源:https://metascience.com。
2021年,元宇宙大潮初起,一石激起千层浪。但元宇宙的确切定义是什么?它与过去的宇宙概念有何区别?“元”字本身的含义究竟是什么?要把这些问题说清楚并不容易。在此,我们略作解读。
汉语中的“元”
元(yuán)字始见于商代甲骨文及商代金文,是个会意字,像一个侧立的人形,上面的一横指明头的部位。“元”字的本义就是头,以此引申为人们的首领等。元所表示的头的含义可引申出开始、开端和第一的意思。“元”也是中国古代的一个朝代名。
元在《汉语大词典》中的主要意思如图3.2所示。
图3.2 元字在《汉语大词典》中的主要意思
英文中的“元”
元宇宙来自英文metaverse。metaverse是meta和universe的结合。metaverse一词由英文前缀“meta”(超越)与“universe”(宇宙)的尾部“-verse”组成,简称MVS。因此,要理解元字,还得从英文的“meta”开始。
希腊词“ μετα ”(meta)作为介词,有多种含义,包括“之后”“有”“中间”。其他含义有“超越”“相邻”“自我”。
实际上,“meta”一词有解释上的拓展,其“变化”的含义就是通过这种介词用法的扩展得到的。这种文本依据至少可以追溯到亚里士多德,当他在形而上学和伦理学的意义上谈论目的、运动、变化这些概念的时候,更多是指地位、身份、秩序、规律、本性、本质的变化。
形而上学的命名,源于亚里士多德部分没有标题的手稿,其正好是在亚里士多德讨论物理学的部分之后完成的。所谓的物理学,在古希腊指的是“自然而然的现象”。而这部分手稿的内容似乎是在探讨自然现象背后的原理、原则,相对而言抽象程度更高。这部分手稿后来被视为亚里士多德《形而上学》的基本内容。这段历史公案后来衍生出对于“形而上学”(metaphysics)这个复合词中“meta-”这一词缀的两种解释。
首先,“形而上学”中的“meta-”指的是在亚里士多德讨论“物理学之后”的意思,代表着学习的过程是从具体现象的描绘到抽象原理、原则之讨论的循序渐进。其次,由于“物理学之后”紧接着形而上学对于自然现象背后之原理、原则的探索,因此“形而上学”中的“meta-”也就有“超越”一切经验现象,并为一切现象“奠基”的意思。顺便一提,“形而上学”这个词是日本明治时期的学者井上哲次郎借用了《易经》中的“形而上者谓之道,形而下者谓之器”一句来翻译英文词“metaphysics”的。
meta与“元”
“meta”,主要表示关于的意思,以meta作为前缀可以表示很多特殊的含义。例如,元数据是关于数据的数据。其他例子还包括元知识、元语言、元记忆、元认知、元情感、元讨论、元笑话、元编程、元游戏、元规则、元理论、元经济学、元哲学、元数学、元定理、元魔法、元句子等。
“meta”词头在大多数情况下均可以翻译为元,如meta-analysis译为元分析,metady-namics译为元动力学,metaverse译为元宇宙。但全部用元来翻译meta有时也不一定妥当,尤其是许多名词中的“meta-”带有动态的意义的时候。例如,“metaethics”翻译为“元伦理学”就不是很妥当,使用“后设伦理学”可能更合适。还有一些我们已经形成固定翻译,不用元,如metaphysics译为形而上学,metastable译为亚稳的。因此,大家翻译meta词头的单词时还是要注意区别对待。图3.3总结了“meta”词头的四种译法。
图3.3 “meta”词头的四种译法
metaverse的本义是超越宇宙。随着科学技术的进步,人类中的一部分科学家开始认识到知识的相对性和人类认识宇宙的局限性,但绝大多数人还停留在“科学是万能的”认识上。从科学的角度来说,人类是无法认识整个宇宙的,更别说超越了。人类只能认知宇宙中很小的一个有限部分,我们称之为世界。因此,确切的词应该是metaworld,而不是metaverse。
目前,公认的元宇宙核心属性有以下几点:
(1)无边界性;
(2)永续性;
(3)高拟真度;
(4)去中心化;
(5)经济系统;
(6)社交体验。
图3.4简要归纳了元宇宙时代人们的三个核心诉求,即身体永生、思想永生和心识永生。元宇宙并不是由单一技术构建的,它所依赖的是一个所有前沿技术的集合。未来元宇宙中的场景也将是在多种技术共同作用下实现的。meta这个前缀有两层意思:一个是元、本质,另一个是超越、超过。我们希望在元宇宙技术的支撑下,人类能够对宇宙的本质、生命的本质、人类的福祉等问题认识得更加深入,人类的活动与世界的生态更加和谐。
图3.4 元宇宙时代人们的三个核心诉求
1966年,早期的一篇元研究论文对发表在10种知名医学期刊上的295篇论文的统计方法进行了研究。研究发现,“在阅读的几乎73%的报告中……它们的结论是在这些结论的理由无效时得出的”。 历史上,科学与科学家的形成也是一个漫长的过程,图3.5展示了意大利西芒托学院创立前后的发展,更多科学院的发展将在本书第三篇与读者见面。
2005年,约翰·伊奥尼迪斯发表了一篇题为《为什么大多数已发表的研究结果都是错误的》的论文,指出医学领域的大多数论文得出的结论都是错误的。这篇论文后来成为公共科学图书馆下载量最多的论文,被认为是元科学领域的基础。
在与杰里米·豪威克和德斯皮娜·科莱西合作的一项相关研究中,伊奥尼迪斯表明,根据建议评估、制定和评价分级方法,只有少数医疗干预措施得到了“高质量”证据的支持 ,在重复包括心理学和医学在内的许多科学领域的结果方面存在较多的困难。这个问题被称为“重复性危机”。元科学的发展是对重复性危机和研究中的浪费问题的回应。
许多著名出版商对元研究和提高出版物质量感兴趣。《科学》、《柳叶刀》和《自然》等知名期刊持续报道元研究和重复性问题。2012年,《公共科学图书馆·综合》杂志发起了一项可重复性倡议。
2015年在爱丁堡举行的研究废物/提高健康研究的质量和透明度会议是元研究领域的第一次国际会议。2016年,人们创立了研究诚信和同行评议的杂志。该杂志的开篇社论呼吁开展研究,以增强我们对同行评议、研究报告以及研究和出版伦理相关问题的理解,并提出潜在的解决方案。
图3.5 意大利西芒托学院创立前后的发展
注:图中列举了学院创立前后出现的重要人物、团体、事件及对应的年份。其中,蓝色虚线连接的是科学家的死亡时间;蓝色实线连接的是科学家做出贡献的年份;灰色实线连接了关系紧密的科学家,例如托里拆利、维维亚尼及美第奇家族做出贡献的两兄弟均为伽利略的门徒。图例中A圆表示未参与学院发展但对其有重大影响的人;B圆表示对学院发展有重大影响的事件或团体;C圆表示对学院有重大贡献的人物,其大小表示贡献力量的大小;D圆表示事件发生的时间点,其大小表示某时间点发生的重大事件的多少。最后由事件线连接的1657—1667年表示一个时间段,在这个时间段里,西芒托学院的科学家们做了很多物理实验。
元科学可分为五大领域,如图3.6所示,分别为方法、报告、重复性、评估和激励。这些分别对应于如何执行、沟通、验证、同行评议和奖励研究。
图3.6 元科学五大领域
注:图中执行、沟通、验证、同行评议和奖励研究,分别是元科学五大领域分支方向所对应的所属标签。
方法
元科学试图找出不良的研究实践,包括研究中的偏见、不良的研究设计、滥用统计数据,并找到减少这些实践的方法。 元研究在科学文献中发现了许多偏见,特别值得注意的是 p 值的滥用和统计数据的滥用。
报告
元研究发现了报告、解释、传播和普及研究的不良做法,尤其是在科学领域。糟糕的报道使得准确解释科学研究的结果、重复性研究、识别作者的偏见和利益冲突变得困难。解决方案包括实施报告标准,提高科学研究的透明度(包括要求披露利益冲突)。通过“临床试验报告统一标准”(CONSORT)和“提高卫生研究质量和透明度”(EQUATOR)协作网等制定指南,人们试图使关于数据和方法的报告标准化。
重复性
重复性是科学过程的重要组成部分,重复性的普遍失败使受影响领域的可靠性受到质疑。重复性危机是一场持续的方法论危机,尤其影响心理学(尤其是社会心理学)和医学研究,包括癌症研究。此外,研究的重复性(或重复性失败)被认为不如原始研究有影响力,且研究成果不太可能在许多领域发表。这阻碍了对研究的报道,甚至阻止了重复性研究的尝试。
评估
元科学旨在为同行评议创造科学基础。元研究评估同行评议系统,包括发表前同行评议、发表后同行评议和开放式同行评议。它还寻求制定更好的研究资助标准。
元科学寻求通过更好的激励机制来促进更好的研究。布莱恩·诺赛克表示,我们面临的问题是,激励机制几乎完全专注于让研究成果发表,而不是让研究成果正确无误。改革的支持者试图构建激励系统,以支持更高质量的研究结果。
有研究提出了科学出版物管理系统的机器可读标准,该标准强调贡献者贡献了什么以及完成了多少研究工作。一项研究指出,与持续忽视贡献的细微差别有关的问题之一是,由于作者名单更长、论文更短和出版物数量激增,发表出版物数量已不再是一个好的衡量标准。
除了提交的优点之外,其他因素也会对同行评议人的评估产生重大影响。这些因素可能也很重要,比如,关于研究人员先前出版物的真实性,有关其与公共利益相一致的记录。然而,评估系统(包括同行评议系统)可能实质上缺乏针对优点、现实世界的积极影响、公共用途的评估机制和标准,而不是缺乏分析指标,如引用次数或影响因子,即使这些指标可以用作实现此类评估目的的部分指标。
激励
各种干预措施(如制定优先顺序)是很重要的。例如,差异化技术发展措施是指有意识地以不同的预防速度开发技术,如控制、安全和政策技术,风险生物技术,通过影响技术开发的顺序来降低风险,主要是全球灾难风险。 仅仅依靠既定形式的立法和激励措施来确保正确的结果可能是不够的,因为这些措施往往实施过于缓慢或不恰当。
管理科学和相关过程的其他激励措施,包括基于元科学的改革,该类改革可能包括确保对公众负责(例如,进行获得公共资助的研究,或以严肃的方式解决各种涉及公共利益的研究课题),增加合格的生产性科学队伍,提高科学研究的效率以提高解决问题的能力,促进基于坚实科学证据的明确社会需求(比如关于人类生理学的证据)得到充分的优先考虑和解决。这种干预、激励设计可以成为元科学的主题。
科学奖是科学奖励的一个类别。元科学可以探索现有和假设的科学奖项体系。例如,研究发现,诺贝尔奖授予仅集中在少数几个科学领域。在114/849个科学领域中,只有36/71个领域至少获得过一次诺贝尔奖,可以根据它们的DC2和DC3分类系统进行划分。114个领域中的5个领域占据了1995—2017年诺贝尔奖数量的一半以上(粒子物理学14%、细胞生物学12.1%、原子物理学10.9%、神经科学10.1%、分子化学5.3%)。
一项研究发现,政策制定者授权(一种自上而下的方法)进行知识生产并为科学提供适当的资金,而科学研究随后以某种方式向社会提供“可靠和有用的知识”,这太简单了。测量结果表明,生物医疗资源的分配与之前的分配和研究的相关性比与疾病负担的相关性更强。一项研究表明,“如果在竞争性选择研究报告和资金时,同侪审查仍然是仲裁的主要机制,那么科学界需要确保它不是武断的”。一项研究表明,有必要“重新考虑我们如何衡量成功”。
预注册
发现科学实践缺陷的元研究激发了科学改革。这些改革旨在解决科学实践低质量或低效的问题。
在进行科学研究之前进行注册的做法,被称为预注册。它的出现是为了解决重复性危机。预注册要求研究者提交一份注册报告,然后根据理论依据、实验设计和拟议的统计分析,该报告会被期刊接受或拒绝出版。预注册有助于防止发表偏见(例如不发表负面结果),减少数据挖掘,并增加可复制性。
在探索新的计算模式和高效实现方式(如图3.7所示)的同时,人们也在采取措施来解决元科学揭示的问题。这些措施包括科学研究和临床试验的预注册,以及成立CONSORT和EQUATOR协作网等组织,发布方法和报告指南。目前,人们正在努力减少滥用统计数据的情况,消除学术界的不正当激励,改进同行评议过程,打击科学文献中的偏见,从而提高科学过程的整体质量和效率。元科学的应用领域包括信息通信技术、医学、心理学和物理学等。
图3.7 探索新的计算模式与高效实现方式
注:从人脑思维出发,从“认知世界”到“创造价值”分为三步。图中7个蓝色图形代表的方面分别对应由线发散连接的实现方式,蓝色字表示细分方向的总结,加粗黑字表示解决思路。
元科学用于创建和改进信息通信技术系统以及科学评估、激励、沟通、调试、资助、监管、生产和管理等。这些可以被称为“应用元科学”,并可能成为探索提高研究数量、质量和产生积极影响的方法。其中一个例子是替代指标的开发。根据一项研究,由于科学中的再现性问题,人们需要用“一种简单的方法来检查重复研究的频率,以及原始发现是否得到确认”。 Scite.ai平台工具旨在跟踪和链接引用论文,以进行“支持”、“提及”或“对比”研究。
医学临床研究的质量往往很差,许多研究结果无法重复。据估计,85%的研究经费浪费了。此外,偏见的存在会影响研究质量。制药业对医学研究的设计和执行具有重大影响。利益冲突在医学文献的作者和医学期刊的编辑之间很常见。产生财务利益冲突与追求更高的研究成功率有关。
在抗抑郁药试验中,药物赞助是试验结果的最佳预测因素。盲法实验(对参加实验的实验组和对照组严格保密)是元研究的另一个重点,让研究者或者观察者也“致盲”或可避免主观人为因素导致的倾向性,但不良致盲导致的错误也是试验偏见的来源。研究表明,由于在抗抑郁药试验中致盲失败,一些科学家认为抗抑郁药并不比安慰剂好。
研究表明,在规划新研究或总结结果时,对现有研究证据的系统性审查是次优选择。对评估医疗干预有效性的研究进行的累积元分析表明,如果在开展新试验之前对现有证据进行系统性审查,那么许多临床试验本可以避免。例如,Lau(刘)等人分析了33项临床试验(涉及36 974名患者),评估静脉注射链激酶治疗急性心肌梗死的有效性。他们的累积元分析表明,如果在进行新试验之前进行系统性审查,那么33项试验中有25项是可以避免的。他们还证实了早期的发现,即大多数临床试验报告没有提供系统性审查来证明研究结果。
现代医学中使用的许多疗法被证明是无效的,甚至是有害的。约翰·伊奥尼迪斯在2007年进行了一项研究,发现医学界大约花了10年时间才停止引用流行做法,因为流行做法被明确证明是不正确的。
元科学揭示了心理学研究中的重大问题。该领域存在高偏差、低再现性和统计数据广泛误用的问题。重复性危机对心理学的影响比对任何其他领域都要强烈,高达2/3的广为人知的发现可能是无法重复的。元研究发现,80%~95%的心理学研究支持它们最初的假设,这强烈反映出发表偏见的存在。
重复性危机促使人们努力对重要发现进行重新测试。为了回应对发表偏见和数据窥探的担忧,140多家心理学期刊采用了单盲或双盲同行评议。在这种评议中,研究被预先注册并发表,而不考虑结果。对此改革的分析显示,61%的结果盲研究产生了无效结果,而在早期的研究中,这一比例为5%~20%。这项分析表明,单盲或双盲同行评议大大减少了发表偏见的情况。
心理学家经常将统计学意义与实际重要性混为一谈,热衷于报告不重要事实的高度确定性。一些心理学家的回应是更多地使用效应大小统计数据,而不是仅仅依赖于 p 值。
理查德·费恩曼指出,物理常数的估计值比偶然预计的更接近公布的值。这被认为是确认偏差的结果:与现有文献一致的结果更有可能被相信,因而被发表。物理学家现在正在实施双盲以防止这种偏见。
科学的目标是描述自然界的真实情况。科学家使用统计模型来推断真相,例如,确定一种治疗方法是否比另一种更有效。每个统计模型都依赖于一组关于数据收集和分析方式以及研究人员选择如何展示其结果的假设。许多学科的科学家都相当一致地认为,对 p 值和统计学意义的误解以及过度强调是真正的问题。2018年,一个由72名科学家组成的小组发表了一篇评论文章,称新发现的统计显著性阈值从0.05变为0.005。麦克·肖恩说,最关键的是, p 值“不应该是看门人”。“让我们从更全面、更细致和更具评估性的角度来看问题。”就连罗纳德·费舍尔的同时代人也支持这一点。1928年,另外两位统计学专家耶日·奈曼和埃贡·皮尔逊在谈到统计分析时写道:“测试本身并没有给出最终的结论,但作为工具,它可以帮助正在使用测试的工人做出最终的决定。”
目前全球有多个从事元研究的机构,包括柏林元研究创新中心、斯坦福大学元研究创新中心、蒂尔堡大学元研究中心、乔治全球健康研究院等。
同时,我们也面临着很多挑战(如图3.8所示),并且有大量的科学问题待探索(如图3.9所示),本书将在第六篇更详尽地介绍。
图3.8 我们面临的挑战
注:本图列举了2019—2021年,在世界科技与发展论坛上逐年提出的十大挑战,它们分别可归属于健康、环境、能源等九大领域。
图3.9 科学问题