



互联网、云计算、人工智能、数字化等,对各行各业产生了深远影响。随着5G通信、人工智能、大数据等新技术的广泛应用,互联网医疗已成为一种全新的诊疗模式。
医疗健康信息化可以分为三个阶段(见图2-1)。
图2-1 医疗健康信息化的三个阶段
第一个阶段是医疗信息化阶段,通过计算机、宽带网络等实现医院信息共享和区域医疗信息共享。
第二个阶段是互联网医疗阶段,借助可穿戴设备、4G网络、云计算、大数据等,实现以在线导流、问诊为主的互联网医疗以及医院内部融合医保的全流程移动。
第三个阶段是智能医疗阶段,人工智能技术全面融入医疗健康全环节,借助医疗机器人、虚拟现实、增强现实、5G网络、人工智能等技术,实现人工智能辅助诊断、远程手术等,实现医疗健康全流程智能化。医疗健康信息化的阶段划分,使医疗健康信息化进程十分清晰。但在实际运行中,互联网医疗和智能医疗是难以分割的,处于融合发展状态。可以说,智能医疗是互联网医疗的延伸和发展,同属于互联网医疗。例如典型的互联网医院,既有互联网医疗技术运用,也有智能医疗技术的运用。
“互联网医疗”的发展可以追溯到21世纪初美国的“移动医疗”,其命名者为帝国理工学院的Istepanina Rober教授。2010年召开的美国移动峰会将“Mobile-Healthcare”(移动医疗)定义为“通过移动设备提供的医疗服务”。
虽然国内移动互联网处于快速发展阶段,但总体来说,互联网仍然占据主导地位。因此,对我国来说,“互联网医疗”要比“移动医疗”更具有概括性与代表性。
因此,“互联网医疗”可以定义为在把握用户需求的基础上,利用互联网技术对传统医疗服务系统进行改革,借助网络平台开展一系列诊断、治疗及信息追踪和健康管理服务,是一种新型医疗服务体系。
1998年远程医疗首次进入中国,但受制于数字化及信息传输水平,此后10多年没有大发展,直到2012年电子病例及互联网等逐渐普及,2014年国家出台规范性指导文件,互联网医疗才开始爆发。特别是2018年,国务院印发《关于促进“互联网+医疗健康”发展的意见》,“互联网+医疗”进入高速发展期,目前已处于全球领先水平。
《中国互联网发展报告(2021)》显示,2020年互联网医疗健康市场规模达1961亿元,同比增长47%,增幅居各行业首位。截至2022年6月,国家卫生健康委公布的数据显示,我国设置审批的互联网医院数量已超1700家,“互联网+医疗”正在成为新型就医方式,人们足不出户看门诊、听医嘱,享受送药到家服务,十分便捷。
目前,我国互联网医院主要有三种形式:一是实体医院自主建立的网络医院,如“××医院”的App或“××医院互联网医院”用户端等;二是以实体医院为依托,与第三方平台合作建立的网络医院,通常只将一部分线下医疗项目延伸至网络平台,如挂号、开药、慢性病管理等;三是独立设置的互联网医院,如近年来将业务拓展至医疗领域的部分互联网企业。
互联网医疗发展成效具体如下。
依托强大的实时连接与交互功能,互联网大大提高了传统领域的服务便捷性。就医疗服务而言,移动互联网已广泛应用于预约诊疗、候诊提醒、划价缴费、诊疗报告查询、药品配送等方面,掌上医疗、O2O药品配送等互联网创新医疗服务形式不断涌现,为广大民众带来了更加高效便捷的医疗服务。
远程医疗服务最早在1998年进入中国,但由于定价、医保及信息化发展等因素的掣肘,发展缓慢。不过,随着互联网的发展成熟及对传统产业的颠覆重塑,加快了远程医疗的发展进程。尤其是2020年新型冠状病毒感染疫情,为远程医疗开辟了更大的发展空间。虽然远程医疗服务仍以诊断、会诊等为主,但与互联网的不断融合使其呈现出一种平台化趋势,医疗、医生、患者、医疗设备、药品、健康大数据等,各种与医疗服务有关的内容和企业都可以纳入平台,从而形成能为用户提供一体化医疗健康服务方案的“空中医院”。
一直以来,医疗资源倒挂是中国医疗体系急需解决的问题:仅占总数8%的三级医院承担了来自全国50%以上的医疗需求,而多数基层医疗资源却长久沉睡、无法调动。互联网医疗被认为是解决这一问题的重要途径之一(见图2-2)。
图2-2 2019年全国医院数量和诊疗人次
资料来源:卫健委、BCG。
互联网医疗使医疗去中心化,减少了医疗服务时间与空间的阻碍,使资源可以更平均地分配。比如,低线城市的患者可以通过互联网诊疗,接触到高线城市的知名专家,免除了线下看诊的挂号困难、舟车劳顿。显而易见的趋势是,新型冠状病毒感染疫情大大推动了数字化医疗发展。医疗服务实现以“医生”为核心到以“患者”为核心的转变,医疗服务与医疗机构也不再是线性关系,而呈现出医疗机构、服务围绕病人的网状关系,医疗的固有结构松动,开始去中心化。
可以说,新型冠状病毒感染疫情的发生,大大推动了医疗去中心化的进程。如河南省巩义市人民医院仅在疫情暴发的2020年,业务量就下降了7%。但传统医疗服务量的减少,并没有阻碍医疗服务的发展。利用互联网医院为百姓提供线上服务,预约检查、预约专家,线上线下相结合,互联网开具药方,通过物流系统送药到家。目前,原本习惯于传统医疗服务的人群,有近1/3接受了线上诊疗服务。百姓深有体会,过去需要长途跋涉去郑州市的医院或者“北上广”的医院看病,现在不需要了。通过信息化,患者在乡镇医院拍的片子,“北上广”的著名专家就可以在线审阅。
现在,很多低线城市医院与“北上广”等高线城市知名医院建立了协作关系,通过互联网,患者在家门口就能得到国内一流专家的诊治,在提升本院医疗技术水平的同时,降低了区域内患者的外转率及看病成本。
早在10年前,百度、阿里巴巴、腾讯三大网络巨头(BAT)就开始进入互联网医疗领域,百度、阿里巴巴、腾讯显示出各自的优势力量,形成了自己的特色(见图2-3)。
图2-3 BAT的互联网医疗战略对比
百度发展互联网医疗以数据采集及分析为支撑,不断拓宽其业务范围。
百度的搜索引擎为其数据分析提供了丰富的信息来源,云计算和大数据的应用为其提供了强大的技术支撑。与其他互联网巨头相比,百度更加注重对数据的利用,通过挖掘数据价值,为药品开发、临床试验、服务流程的调整与完善、线上诊疗、医疗方案的制订等提供信息参考。百度主要以数据采集为开端,建立了百度医生、拇指医生以及百度健康,为用户提供挂号、咨询及信息搜索服务,并与好大夫、趣医网建立合作关系,整合不同平台的优势资源。在线下服务方面,与解放军总院、301医院、上海华山医院等多家医院建立合作关系,还与相关药品生产商进行合作,不断完善医疗服务闭环。
阿里巴巴采取双线发展策略,即传统医疗体系与互联网医疗体系并行发展。
移动支付是阿里巴巴进入互联网医疗的入口与开端。在激烈的市场竞争中,支付宝不仅是阿里巴巴的优势所在,而且为阿里巴巴发展互联网医疗奠定了基础。
2014年5月28日,支付宝推出“未来医院”计划,以传统医疗服务模式的改革与完善为主导。按照传统的就诊流程,患者需要排队挂号、等待叫号、排队支付,而通过支付宝平台,患者可以在网上完成支付、挂号等操作,节省了时间与精力。到2016年,国内大约400家大中型医院与该平台达成合作。
在互联网医疗模式下,支付宝推出“医蝶谷”平台,旨在提高医生资源的使用价值,扩大医疗服务的覆盖范围。阿里健康云医院“医蝶谷”于2015年4月1日正式上线,通过该平台的运营,阿里巴巴旨在提高医疗体系的运作效率,通过网络平台满足用户的医疗健康需求。从根本上来说,阿里巴巴为基层社区医疗服务提供线下及平台支持,顺应了国内分级诊疗的发展潮流,使不同级别的诊疗机构之间实现信息交流,有助于互联网医疗生态体系的建立。“医蝶谷”为医生自由执业的实现提供了平台支持。另外,其与第三方医学诊断服务机构“迪安诊断”联手,建立完整的医学检验系统,取得了初步成效。
2014年1月23日,阿里巴巴与三峰基金共同投资了中信21世纪股份有限公司,占有54%以上的股份,标志着阿里巴巴正式进军互联网医疗领域。中信21世纪是中信集团旗下的香港上市公司,涵盖电信服务、多媒体业务、软件开发业务及互联网相关业务等,其于2014年10月21日正式更名为阿里健康信息技术有限公司。阿里巴巴看重的是,中信21世纪拥有国内唯一的药品监管码体系,通过收购,阿里巴巴拥有了“95095”平台,能够获取到药品在整个流通过程中的数据信息,通过数据分析及处理挖掘其应用价值。
阿里巴巴还与太保安联公司合作,共同探索互联网健康险产品,开发商业健康保险服务新模式,打造种类丰富的健康保险服务。除了将健康险产品中的投保、理赔申请、审核、支付等流程推到线上之外,还大力开发适合互联网场景需求的新产品,尤其是针对阿里健康云医院的患者设计相应的产品。
经过8年的开拓发展,阿里巴巴的互联网医疗已开始盈利。
腾讯围绕微信建设互联网生态体系,即“互联网医院+区域互联网医联体+医保支付方式改革”。
腾讯在发展互联网医疗生态体系的过程中,围绕微信开展一系列建设,通过微信平台的应用,加强患者与医生的信息交流,开始涉足互联网医疗市场。2014年9月,腾讯投资7000万美元于医疗健康互联网公司丁香园、4000万美元于医联网。丁香园偏重于学术研究,医联网偏重于实践,两者的共性在于针对的人群都是医生。这样腾讯将互联网的核心资源医生牢牢掌握在手中。
2015年9月,腾讯以1亿美元领投挂号网,并更名为微医集团,它的发展目标为:在国内所有地区建立线上分级诊疗平台,实现医疗资源的共享;建立中国式的微医责任医疗组织;利用资金优势,联手医院发展线下医疗,不仅掌握了医生资源,还抓住了流量入口,逐渐形成完整的互联网医疗生态系统。
微医集团的成立发展标志着腾讯进入了互联网医疗的深水区,走出了“互联网医院+区域互联网医联体+打通医保支付”的创新路径,无疑是国内互联网巨头进军互联网医疗领域的典范。
2015年,微医创办了全国首家互联网医院——乌镇互联网医院,开启了在线处方、在线复诊、远程会诊等融合创新的先河,打破传统医院围墙,使医疗全流程中的服务数据互联互通,形成线上线下医疗服务闭环,为互联网医联体建设提供了必要的前提条件。
2017年,微医以河南郏县作为试点,依托互联网医院平台和资源,构建县、乡、村三级医疗机构智能分级诊疗体系,通过微医自主研发的“流动医院”,以“车、包、站”(包括云巡诊车、云巡诊包、医卫工作站)的新组合形式,赋能基层医疗机构。截至2020年底,郏县完成家庭医生签约47.6万人,签约率达73.2%,重点人群签约率同比增长6.37%,履约率同比增长7.52%。
针对慢性病的特点,2019年,微医依托互联网医院打造互联网慢病医联体首次落地,也是城市医保部门直接购买数字慢病管理的模式创新。该模式涉及慢病线上线下全流程,形成慢病管理的防、诊、治、管、健的全生命周期管理闭环,并通过数字化、规范化的全流程管理,强化了医保监管和控费。仅一年时间,当地慢病患者单次人均就诊时间就从2~3小时减至30分钟,单次处方金额较2019年下降12.7%,极大地优化了患者的就医体验,减少了用药支出。
相比传统医院的投入产出,微医仅花了两年时间就证明了其商业价值。微医在泰安、济南、天津等地运营的互联网医院营收已接近三级医院规模。在泰安落地的慢病互联网医院,年问诊量已近90万人次,这还不包括其他非慢病患者的日常在线问诊业务。目前,微医在全国共有30余家互联网医院,其中18家实现了与医保系统的联通。在微医互联网医院平台上,已形成规模相当于30家的三级医院。
微医互联网医疗最大的亮点在于抓住了医生这个核心资源,并通过微医ACO(Accountable Care Organization,责任医疗组织)方式,最大限度地发挥医生作用。微医通过ACO为用户提供三级医疗保障服务,即第一级责任医生组、第二级当地三级医院、第三级学科带头人。其最大特色为责任医生组。每个责任医生组主要服务方圆3公里之内的用户,鉴于我国全科医生规模相对较小,责任医生组通常都由内科、外科、儿科等多种类医生组成,他们可以为用户提供类似于美国家庭私人医生般的服务,只不过通常是一对多模式。“微医集团”成立时,已经拥有2800个微医团队,并与遍布全国的1600多家重点医疗机构、超过19万名医疗专家达成战略合作。目前已与上百万名基层医生建立合作关系,在全国范围内建立起了“互联网分级诊疗平台”。
对谷歌母公司“字母表”、苹果、元宇宙平台(脸书母公司)、亚马逊和微软等5家美国IT巨头及其关联企业申请并公开的13万件专利信息进行分析,从中可发现他们正将关注点转向健康管理的数字化技术积累。2010年到2020年,相关专利申请数量达到21世纪最初10年的约10倍。在健康管理和远程医疗领域,它们正在加快收集数据、抢夺客户。预计到2027年,数字健康领域的市场规模将达到1300亿美元。各大企业正展开竞争,力争尽快实现随时随地进行诊疗与治疗的梦想。
近年来,IT巨头在医疗保健行业数字化转型中投入了相当多的资源。从2010年开始,原本与医疗保健没有多少关系的IT巨头的相关专利申请开始增加。从2000年到2009年,每年的专利申请数量超不过10项,但从2010年开始,每年陡增至100项。
从专利涉及的领域看,收集生物信息的生命体征监测专利累计达到800项,从2016年开始,5年时间里增长了34%。同一时期,包括远程医疗、电子病历等在内的医疗信息通信技术(ICT)专利申请达到227项,增长了50%。包括人工智能解析技术在内的生物信息通信技术相关专利申请达到78项,增长了63%。
各企业都在抢占市场,预计人类即将迎来健康管理行业真正意义上的数字化转型。美国大型风险投资公司安德烈森—霍罗威茨公司预测,以远程医疗为代表的数字化转型将使得医疗保健行业远离传统医院,走入我们的居所和工作场所。
从专利数量看,微软、“字母表”和苹果位居前三。这些IT巨头除了抢占数据和客户之外,还在收购或与拥有相关技术的初创企业合作,积极延揽人才。
微软利用在线聊天软件Teama和Azure云技术为医疗机构提供服务。2021年4月,微软宣布斥资197亿美元收购知名语音识别企业纽安斯公司,2022年2月交易完成,未来将致力于为医疗保健行业提供智能语音服务。
微软在远程医疗、电子病历等方面优势明显。2018年,微软公布了通过AI技术分析患者的活动数据、掌握患者在家运用食疗方法和运动疗法的效果,并据此修改诊疗计划的专利。除了拥有自动汇总电子病历信息并发送给患者的技术外,微软还掌握了把健康状况和运动能力等信息发送给Avatar平台,确保与医生顺畅沟通的技术。
“字母表”公司旗下不仅有谷歌,还有专注生命科学健康的韦里利公司、在生物医疗AI技术方面表现卓越的英国“深层思维”公司,以及2021年收购的智能可穿戴设备公司、运动追踪者公司。该公司拥有众多可服务于医疗机构的专利,如利用AI从CT影像中检测是否发生癌变的技术及通过电子病历预测患者未来的健康状况。
苹果销售的苹果手表则能够诊断包括心电图在内的健康状况,在智能手表行业领先其他公司。从专利分析看,该公司在更贴近消费者的生命体征监测领域拥有强大的技术优势。
苹果在2021年公开了利用耳机监测体温的专利技术。2022年3月公布的一款可穿戴标签,则可以挂在衣服或是身体的任何部位,用来确认身体姿势、掌握光照强弱。
日本把智慧医疗作为建立智慧城市的重要组成部分。从2011年开始,日本政府依托索尼、富士通、松下、欧姆龙等公司,借助网络平台,推出了大批线上居家医疗、照护产品,推行高品质数字生活理念下的“家庭移动医疗护理”模式,服务内容涉及视讯医疗,开发对慢性病患以及老幼病患进行远程照护,对智障、残疾、传染病等特殊人群进行健康监测及智能服药的系统。2016年,日本政府制定智能社会5.0战略,推进大数据与人工智能在预防、健康管理、远程医疗领域的应用。日本电子业巨头纷纷转型智慧医疗产业,积极开发与老年疾病有关的智慧医疗产品。
与此同时,日本全面参与海外如东南亚智慧城市建设,将智慧医疗嵌入智慧城市的建设中。日本大约有200家企业参与到东南亚国家的26个城市的智慧城市建设项目,涵盖菲律宾的新克拉克城(New Clark)、越南河内岘港、缅甸的第二大城市曼德勒(Mandalay)、马来西亚的亚庇(Kota Kinabalu)、印度尼西亚的雅加达等城市。松下公司在日本横滨市利用IT技术进行创建宜居城市的尝试,包括智慧能源管理、交通系统、安全管理、教室系统、智慧经济、智慧医疗和智能生活。总之,日本将智慧医疗嵌入智慧城市的建设中,并将此模式在全世界推广。
3.0时代的智能医疗是互联网医疗发展的新阶段,它的主要模式是人工智能全面融入医疗健康全环节,实现医疗健康全流程智能化。
人工智能是什么?知名自然语言处理搜索专家吴军博士在《智能时代》一书中有精辟的概括:“人工智能”这个名词严格地讲在今天有两个定义,第一个是泛指机器智能,也就是任何可以让计算机通过图灵测试的方法,包括我们在本书中要经常讲的数据驱动方法。第二个是狭义上的概念,特指20世纪五六十年代特定的研究机器智能的方法(传统的人工智能方法)。
通过对人工智能本质的分析,我们可以看出计算机获得智能的方式和人不一样。它并非通过模仿人的思维方式产生,而是建立在大数据、摩尔定律和数学模型基础之上,将过去需要通过人类智力才能解决的问题变成计算问题,最后在效果上达到人的水平甚至超过人的水平。我们人类的智能活动,包括思考和推理,时常并不需要很多数据也不需要大脑有很强的计算能力,甚至不需要像计算机那样消耗较高的能量。因此,直到今天,人的智能和机器智能还是各有擅长、各有千秋,全面比较孰优孰劣其实没有意义。但是,我们必须看到,人类的智力是有极限的,今天在很多方面人工智能已经超过了人类。这不仅体现在下棋方面,还体现在人脸识别、医学影像等很多方面。
在人工智能的发展过程中,人们对机器智能的本质认识,有一个由不认识到深化认识的渐进过程。在电子计算机诞生之后的第十年,也就是1956年,发明计算机中开关逻辑电路的克劳德·香农和一群年轻的学者在达特茅斯学院召开了一次头脑风暴式研讨会。会议的倡议者除了香农,还包括当时只有29岁的约翰·麦卡锡、马文·明斯基和27岁的纳撒尼尔·罗切斯特。会议选在了麦卡锡任职的达特茅斯学院举行,参会者一共10人,除了上述4人,还有6位年轻的科学家,包括赫伯特·西蒙(Herbert Simon, 1916—2001)和艾伦·纽维尔(Allen Newell, 1927—1992)。由于会议召开时间是在夏天,因此会议被称作“达特茅斯夏季人工智能研究会议”。但是它不同于今天一般只召开几天的学术会议,因为一来大家并没有可以报告的科研成果,二来这个会议持续了整整一个暑期。事实上,这是一次头脑风暴式讨论会。参会的10位年轻学者讨论的是当时计算机科学尚未解决,甚至尚未开展研究的问题,包括人工智能、自然语言处理和神经网络等。人工智能便是在这次会议上被提出的。
早期研究机器智能的方法,即传统的人工智能方法,是先了解人类是如何产生智能的,然后让计算机去模拟人思考。通俗地讲,就是“让计算机能够像人类一样思考,像人类一样看懂,像人类一样听懂,像人类一样运动”。当然,到了今天几乎所有的科学家都不坚持“机器要像人一样思考才能获得智能”,但是很多门外汉在谈到人工智能时仍然想象着“机器在像我们那样思考”,这让他们既兴奋又担心。
为什么早期科学家的想法会和今天的门外汉一样天真呢?道理很简单,因为这是根据我们的直觉最容易想到的方法。人类历史上,很多领域早期的尝试都是模仿人或者动物的行为。比如人类在几千年前就梦想着飞行,于是开始模仿鸟,在东方和西方都有类似的记录,用鸟的羽毛做成翅膀绑在人的胳膊上往下跳,当然实验的结果可想而知。人们把这样的方法论称作“鸟飞派”,也就是看着鸟是怎样飞的,就能模仿鸟造出飞机,而不需要了解空气动力学。事实上我们知道,莱特兄弟发明飞机靠的是空气动力学而不是仿生学。这里,我们不要笑话前辈来自直觉的天真想法,这是人类认识的普遍规律。
到了20世纪70年代,人类开始尝试机器智能的另一条发展道路,即采用数据驱动的方法,而这个尝试始于工业界而非大学。
1972年,康奈尔大学的教授弗雷德里克·贾里尼克(Frederick Jelinek, 1932—2010)到IBM做学术休假,正好这时IBM想开发“聪明的计算机”,贾里尼克就“临时”负责这个项目(语音识别)。当时传统人工智能语音方法有点像教大家学外语,利用这种方法得到的最好语音识别系统大约能够识别百十来个单词,识别率只有70%左右。
贾里尼克是一位世界级通信专家,他找到了一条不同于传统人工智能的语音识别方法,他还喜欢招收数学基础好的,特别是学习过理论物理的员工。出于某种原因,他不喜欢语言学家,并且把他们都请出了IBM。贾里尼克的团队花了4年的时间,开发了一个基于统计方法的语音识别系统,这个系统把语音识别率从过去的70%左右提高到90%以上,同时语音识别的规模从几百个词上升到两万多个词。
贾里尼克和他的同事在研究语音识别时,无意中开创性地采用了数学统计模型及大量数据的数据驱动方法来解决智能问题。这种方法最大的好处是,随着数据量的积累,系统会变得越来越好。相比之下,过去传统人工智能的方法很难受益于数据量的提升。
数据驱动方法从20世纪70年代起步,在八九十年代得到缓慢但稳步的发展。进入21世纪后,互联网的出现使得可用的数据量剧增,数据驱动方法的优势越来越明显,最终完成了从量变到质变的飞跃。如今很多需要类似人类智能才能做的事情,计算机已经可以胜任了,这得益于数据量的增加。
从某种意义上讲,2005年是大数据元年。大数据与大规模数据不能混为一谈。大数据有三个特征:第一个特征,也是最明显特征即体量大;第二个特征是多维度;第三个特征是它的全面性,或者说完备性。大数据是一种思维方式的改变。现在的数据量相比过去大了很多,量变带来了质变,思维方式、做事情的方法就应该和以往有所不同,这是帮助我们理解大数据概念的一把钥匙。在有大数据之前,计算机并不擅长解决需要人类智能来解决的问题,但是今天这些问题换个思路就可以解决了,核心就是变智能问题为数据问题。由此,全世界开始了新一轮的技术革命——智能革命。
2016年是机器智能史上具有纪念意义的一年,它既是一个时代的结束,也是新时代的开端。这一年距离1956年达特茅斯会议提出人工智能概念正好过去了60年,按照中国的习惯来说,正好过去了一个甲子。谷歌的围棋计算机Alpha Go(阿尔法围棋)在与世界著名选手李世石的对局中,以4∶1取得了压倒性胜利,成为第一个战胜围棋世界冠军的机器人。它的意义远远超过1997年IBM(国际商业和机器公司)的深蓝战胜卡斯帕罗夫,因为从难度上讲,围棋比国际象棋要难6~9个数量级。这不仅是人类在机器智能领域取得的又一个里程碑式的胜利,而且标志着一个新的时代——智能时代的开始。
2016年3月9日,Alpha Go和李世石的世纪大战开始了。Alpha Go在第一盘出乎意料地轻松获胜。当然,大部分人在赞誉Alpha Go水平的同时,依然认为这可能是李世石在试探计算机而已,毕竟那是五盘棋的比赛,用一盘棋试探自己毫不了解的对手未尝不是明智之举。但是当Alpha Go在第二盘获得连胜并且下出了很多人类预想不到的好棋后,对机器智能持怀疑态度的人都对它产生了敬意。在Alpha Go获得第三盘胜利之后,很多超一流的棋手都渴望和它一战,希望以此检验自己的水平,并提高棋艺。虽然李世石在第四盘抓住Alpha Go的一个失误打了一个漂亮的翻身仗,但是Alpha Go在最后一盘稳稳地控制住局面,直到胜利。可以讲在那一次人机大战之后,围棋界对机器智能从怀疑变成了顶礼膜拜,大家都意识到,按照Alpha Go在过去几个月里的进步速度,只要谷歌愿意继续进行科研,很快人类所有的围棋高手都无法和它过招儿了。
计算机之所以能战胜人类,是因为其获得智能的方式和人类不同,它不是靠逻辑推理,而是靠大数据和智能算法。在数据方面,谷歌使用了几十万盘围棋高手对弈的数据来训练Alpha Go,这是它获得所谓“智能”的原因。在计算方面,谷歌用了上万台服务器来训练Alpha Go下棋的数学模型,并且让不同版本的Alpha Go相互对弈了上千万盘,这才保证它能做到“算无遗策”。具体到下棋的策略,Alpha Go有两个关键技术,一个关键技术是把棋盘上当前的状态变成一个获胜概率的数学模型,这个模型没有任何人工规划,完全依靠前面所说的数据训练出来的;另一个关键技术是启发式搜索算法——蒙特卡洛树搜索算法(Monte Carlo Tree Search),它能将搜索的空间限制在非常有限的范围内,保证计算机能够快速找到好的下法。
虽然训练Alpha Go使用了上万台服务器,但它和李世石对弈时仅仅用了几十台服务器(1000多个中央处理器的内核以及100多个图形处理器),相比国际象棋,围棋的搜索空间要大很多倍。Alpha Go的计算能力相比深蓝,其实并没有这么多倍的提高,它依靠的是好的搜索算法,能够准确地聚焦搜索空间,因此能够在很短的时间里算出最佳行棋步骤。由此可见,下围棋这个看似智能型的问题,从本质上讲,是一个大数据和算法的问题。
通过对人工智能发展历程的回顾,我们对吴军博士关于人工智能的定义有了进一步的理解。现代的人工智能是统计决定论,而“传统”的人工智能是逻辑推理决定论。人工智能的要义在机器智能,它不是模仿人的思维方式产生,而是建立在大数据、摩尔定律和数学模型基础之上,将过去需要人类智力才能解决的问题变成计算问题,并在效果上达到人的水平甚至超越人的水平。
智能时代,实际上就是人工智能+IoT(物联网)时代,这是今后20年IT产业的范式。
IoT是第三代互联网,互联网发展至今已经完成了两代,正向着第三代过渡。
起初,互联网是远程终端和超级计算中心大型机之间的联网,后来演化成个人计算机通过服务器彼此相连。因此,第一代互联网从本质上讲是计算机和计算机的联网。每一个使用互联网的人,身份只有通过账号和IP(互联网协议)地址来确认,也可以说,人通过互联网相连是间接的。21世纪之前,用户上班登录邮箱查看邮件或者登录QQ聊天,即为登录互联网,下班离开了计算机,就离开了互联网。直到其坐回到计算机旁边,才算又回到互联网上。
第二代互联网是我们今天使用的移动互联网,它的本质是人和人的相连。虽然从形式上讲,联网的设备由过去的PC机变成了智能手机,连接的方式从物理的网线变成了空间振动的无限电波。但在移动互联网时代,每个人要找的不是对方的手机,而是找对方那个人。你见到一个新朋友,提出要扫一下微信二维码,这不是为了让你的手机能够连接上对方的手机,而是要随时找到那个人。这样除了带来便利性,还带来了两个结果。
第一个结果是网络上的人和真实的人基本上是一致的(现在新增手机号用户要求用真实身份登记),这一点在PC互联网时代是很难做到的。那个时候面临一个能否信任对方的问题,因为你无法知道电脑背后的人到底是谁。雅虎在2001年互联网泡沫破碎之前曾经提供类似eBay的交易平台,但是因为无法确认屏幕背后的人,难以制止虚假交易和诈骗行为,很快就停止了服务。由于反欺诈的成本极高,大部分电子商务网站都因此(而非价格竞争)而停止服务。
移动互联网连接真实的个人的特点,不仅让电子商务变得容易,而且人的真实身份和网络身份的一致性,使得移动支付成为可能。当然,如果一个人在网络上发表了违反法律的言论,也会被发现并且可能被处罚。
第二个结果是每一个人的线上行为和线下生活可以很好地融合。今天网上打车、线上线下相结合的电子商务、定位,都与之有关。因此,以移动互联网为特征的第二代互联网并非简单地将联网设备由个人计算机变成手机,而是在人与人的连接方面有本质性突破。
第三代互联网就是万物互联网。IoT翻译成“物联网”,从字面上讲没有错,但是没有正确地表达IoT的含义。因为,T(things)在这里是指万物,除了我们一般理解的东西,还包括已经连接到互联网中的各种终端设备(如计算机和手机),更包括我们自己。
万物互联网离不开移动互联网的发展,因为我们不可能把世界上各种事物都用信号连接在一起,更不可能用这种方式把我们自己连接到网上。在移动互联网早期,万物互联这件事更是不可能的。不仅因为当时移动互联网的带宽不够,无法提供现在几十倍数量的IoT设备上网,而且过去的移动互联网也没有考虑IoT设备的联网问题。直到今天,大部分IoT解决方案看上去还是凑合的,通常在固定的场所,那些IoT设备都需要通过Wi-Fi路由器上网,或者通过蓝牙和手机等移动设备相连;在一些需要移动的场合,比如在我们身上,蓝牙几乎是连接IoT的唯一方式。这种解决方案有点像过去家用的无绳电话,看上去能够移动,但是离不开家里的“小基站”,和真正的无线通信手机完全是两回事。
催生IoT的第一个决定性技术是传感器技术。在一般人的想象当中,传感器就是一个很小的机械或者电子器件,能够测量某些物理量,如温度、时间、压力等。这只是过去狭义上的传感器,今天传感器的概念要宽广得多,任何能够采集数据的设备都是传感器。比如:
● 智能汽车。虽然这些汽车内部有很多传感器监控它的运行情况,但是它本身也是一个传感器,收集我们使用汽车的全过程数据,并且跟踪我们某些生活习惯。
● 工业控制设备。这个比较好理解,因为控制通常都需要从传感器获得信号。
● 智能家电和智能家居。能够被智能App控制的各种家电设备。
● 智能手机。智能手机无时无刻不在收集我们的数据。
● 监控设备。如大量的、各种各样的摄像头。
● 可穿戴式设备。除了大家熟悉的智能手表、手环,还包括能监控我们身体的医疗设备,如监控我们体内血糖水平的隐形眼镜。此外,一些植入体内的医疗设备,如心脏起搏器,其实也是传感器,可以记录使用者至少半年的心脏活动情况,且能通过无线通信输入医院的计算机中。
在IoT时代,每一个人(不仅是在网络上)都有一个完整的画像,这个画像可能完整到我们自己都不相信。喜欢也好,不喜欢也罢,它正在发生,且随着万物互联网的普及,这些连接会越来越完整。
在这些连接中,人依然是一个中心,虽然不再是唯一的中心。任何一架商用客机的发动机,里面都有1000多个传感器,它们对发动机的各种情况,甚至机身外部状况(如空气的温度和湿度)都能随时监控,每天产生的数据超过1GB。一旦发动机出现故障,可及时被发现并且定位问题所在。
在“人工智能+IoT”这样一个智能时代,我们将获得空前的便利性和安全感,各种经济活动和社会活动都能得到保证,隐私和信息安全问题也可能得到解决,经济和社会必将大踏步前进。
智能时代一切皆有可能,一切皆是未知。人工智能改变了产业格局,使一些新的产业出现,但更多是对现有产业的改造。对医疗健康行业来说,将迎来崭新的形态。
从延长寿命、保证生活质量这个目的来讲,比治疗更重要、更有效的是疾病预防,以及早发现疾病。20世纪60年代,美国投入巨资用于医疗,结果10年间人均寿命提高了0.7岁。到了70年代,美国改变做法,将重点放在疾病的预防上,用10年时间将人均寿命提高了2岁多。
中国自古就有健康重在“治未病”,即预防为主的思想,现代健康管理契合了这种理念。从饮食、运动、心理平衡及慢病管理等方面,进行人的生命全过程全周期的管理,让人们不得病、少得病、缓得病、得病后早康复。人工智能和物联网技术广泛融合并应用于健康管理,贯穿人们的全生命周期的数据采集、监测过程,并对各项数据指标进行综合智能分析,服务于人们的健康管理,从而提高健康干预和管理水平。
健康管理的范畴非常广,从全球人工智能在健康管理中的应用来看,主要集中在风险识别、虚拟护士、精神健康、移动医疗、健康干预以及基于精准医学的健康管理。
风险识别主要是通过人工智能进行分析,识别疾病发生的风险及提供降低风险的措施。如风险预测分析公司Lumiata,通过其核心产品——风险矩阵(Risk Matrix),在获取大量的健康计划成员或者电子病历、病理生理学等数据的基础上,为用户绘制患病风险随时间变化的轨迹。公司首提的医疗图谱Medical Graph是预测分析产品背后的引擎,主要有两大功能:一是映射出当前和未来个人健康的轨迹;二是在每一个预测背后,提供详细的临床基本原理说明。医院利用图谱分析对病人做出迅速、有针对性的诊断,从而将病人分诊时间缩短了30%~40%。客户群体包括大型健康计划、护理机构、数字健康公司等。
虚拟护士主要是以“护士”身份了解病人的饮食习惯、锻炼周期、服药习惯等个人生活习惯信息,运用人工智能技术进行数据分析并评估病人整体状态,协助其规划日常生活。如Alme Health Coach,针对慢性病病人,基于可穿戴设备、智能手机、电子病历等多渠道数据的整合,综合评估病人的病情,提供个性化健康管理方案,帮助病人规划日常健康安排,监测睡眠,提供药物和测试提醒。又如,Ai Cure通过智能手机摄像头获取用户信息,结合人工智能技术确认病人的服药依从性。
精神健康主要是运用人工智能技术对语言、表情、声音等数据进行情感识别。如Ginger.IO通过挖掘用户智能手机数据发现用户精神健康状况的微弱波动,推测用户生活习惯是否发生了变化,根据用户习惯主动对用户提问。当情况变化时,会推送报告给用户身边的亲友甚至医生。又如,Affective公司的一项技术通过手机式电脑摄像头实时分析人的情绪。
移动医疗主要是结合人工智能技术提供远程医疗服务。如在线就诊服务,Babylon开发的在线就诊人工智能系统,能够基于用户既往病史、用户与在线人工智能系统对话时所列举的症状,给出初步诊断结果和具体应对措施。远程用药提醒服务,Ai Cure是一家帮助用户按时用药的智能健康服务公司,它通过手机终端,帮助医生知晓,并提醒患者用药,降低因不按时吃药导致复发的风险。
健康干预主要运用人工智能对用户体征数据进行分析,定制健康管理计划。Welltok通过旗下的Cafe Well Health健康优化平台,运用人工智能技术分析来源于Map My Fitness和Fitbit等合作方的可穿戴设备的用户体征数据,提供个性化的生活习惯干预和预防性健康管理计划。
我们所说的预防,包括疾病的早期发现。在各种疾病中,大家最希望能够做到早期发现癌症,因为如果能够及早发现癌症,治愈它或者控制它的可能性要大很多。
2 016年,硅谷成立了一家叫作Grail的公司,它致力于通过基因检测和大数据相结合的办法,发现早期癌症。Grail的技术源于世界上最大的基因测序仪器公司(Illumina)的一个内部项目。作为全世界最大的基因测序设备公司,Illumina有很多(十几万)孕妇的基因数据。在这十几万人中,有20个人的某项数据有点怪。由于人数少,而且这些人也没有什么不健康的地方,因此没人在意。几年后的一天,Illumina新上任了一位首席医疗官(CMO),他是一位医学专家,在无意中看到了这个数据,断定这20个人都患有癌症。医生们都不相信,说她们还年轻,很健康。但是这位首席医疗官坚持给她们做了进一步检查,结果都确诊是癌症。
Grail在英语里有一个特殊含义,就是传说中的圣杯(也被称为Holy Grail)。据说喝了圣杯里的水,人就能百病不侵,长生不老。Grail筛查癌症的方法是跟踪血液中的基因变化。如果人体内出现了癌细胞,死去的癌细胞和被白细胞吞噬的癌细胞会进入血液,血液里就会有癌细胞的基因。通过对血液中各种细胞的基因检测,就有可能在早期发现癌症。当然,这里面涉及基因的测序和大量的计算,这种方法成本高昂,这既是其他公司和科研机构过去不愿意采用的原因,也是Grail公司发挥其技术特长之所在。Grail的工程师主要来自谷歌,他们在亚马逊工程师的帮助下,将计算的成本降低了99%。2018年,Grail完成了第二轮高达12亿美元的融资,由高管领投,世界上最有名的制药厂有一半,包括强生、默克和施贵宝等都参与了,著名的风险投资机构凯鹏华盈、中国的腾讯以及中国香港的陈氏兄弟公司也设法挤了进去。
目前,Grail通过验血可给出4个结论:
● 是否有癌症。
● 如果有,癌细胞长在了哪里?因为不同癌症的癌细胞基因不同。
● 如果有,癌症发展的速度如何?有些癌症发展得很慢,有些甚至可以自愈,但有些发展得很快。
● 如果有,癌细胞对放射性物质是否敏感,对药物是否敏感,这样就知道如何治疗了。
截至2018年,Grail公司已经能够准确检测直径2厘米左右的肿瘤(或者癌变区),而通常肿瘤被发现时平均直径为5厘米。可见,Grail跟踪人体内基因的技术,比现有的癌症检测技术有了很大进步。Grail的目标是在肿瘤小于0.5厘米时发现它。至于为什么不能更早期地发现癌变,Grail认为没有必要,因为人体内时不时有基因突变的细胞,但是大部分会自愈,不会对我们的身体造成伤害。如果对病变过度预警,反而引起人们的恐慌,对身体不利。2019年,美国食品药品监督管理局(FDA)批准了Grail的服务进入临床试验。此前这一服务已获得英国、中国香港及华南地区的实验许可。预计在不久的将来,Grail可以将全身癌症筛查的成本控制在500美元以下。
Grail技术的本质,其实是对人体基因变化的跟踪。今天一辆汽车配置上百个传感器监控和跟踪其运行情况,一个喷气式发动机则装配上千个传感器记录其运行的细节。有了这些传感器,就能及早发现隐患,解决故障,达到延长使用寿命的目的。但是,我们对自身状态的跟踪这一服务才刚刚开始。Grail的技术只是对人体非常复杂的新陈代谢的一种简单跟踪,在未来,更复杂的技术会不断出现,可以监控我们身体的各种变化。因此,健康保健在很大程度上就变成了一个信息处理的问题。
在过去,放射科医生的工作,被认为需要较高的专业技能,不可能被机器取代。但是,今天的智能识别软件通过对医学影像的识别和分析,可以比有经验的放射科医生更好地诊断病情,这将从根本上改变医疗行业的现状。
科学家和医生通过智能识别和图像理解进行医学影像分析不是在有了大数据以后才开始的。早在20世纪70年代图像处理技术起步时,人们就想到了它在医学上的应用。但是真正取得突破性进展,且能够比人做得更好,则是近几年的事情,因为计算机有了大量的数据可以学习。
在很多中国患者的心目中,看病要找“老大夫”,因为他们有经验。实际上,老大夫经验的积累就是一个通过病例(数据)学习的过程,而人的学习速度怎么也跟不上计算机。一个放射科医生一生接触的病例很难超过10万个,而计算机很容易通过上百万个病例进行学习。2012年,谷歌的一项科学比赛,第一名授予了一位来自美国威斯康星州的高中生,她通过对760万个乳腺癌患者的样本数据的机器学习,设计了一种确定乳腺癌癌细胞位置的算法,帮助医生对病人进行活检,其位置预测的准确率高达96%,超过目前专科医生的水平。这位年轻学生采用的图像处理和机器学习算法并不复杂,她的成功完全得益于大数据,没有哪个医生一生能够见识760万个病例。
人工智能应用于医学影像,主要通过深度学习,实现机器对医学影像的分析判断,是一种协助医生完成诊断、治疗工作的辅助工具,帮助医生更快地获取影像信息,进行定性定量分析,提升医生看图/阅读的效率,协助其发现隐藏病灶。
放射科医生阅片方式和病理医生阅片能力与其阅片经验(大脑中储存的细胞病理形态)的丰富程度高度相关。医生读片首先是认知图像。从心理学上来说,认知图像的关键在于模式和识别能力。模式是将当前看到的图像与记忆中有关的参照物(模板、原型、特征等)进行对比,典型的模式有模板匹配模式、特征分析模式、傅里叶模式等。具体来说,病理学家在读片的时候,会快速搜索大脑中的典型细胞病理学形态,并进行存储。
人工智能在阅片速度和经验方面具有优势,用深度神经网络来识别病理图片,即使不考虑并行处理和计算加速,阅读一张病理片也不会超过40秒。受能力所限,病理医生的读片量有限,经验积累也有限。医生阅读一张病理片的时间可能是几分钟,也可能是一整天。IBM Watson可以在17秒内阅读3469本医学专著、248000篇论文、69种治疗方案、61540次试验数据和106000份临床报告。通过海量汲取医学知识,包括300多份医学期刊、200多本教科书及近1000万页文字,IBM Watson在短时间内可迅速成为肿瘤专家。
人工智能应用于影像诊断不仅可以提速,还可以提高精准度。医学影像数据的人工分析,有很多不足,如大量的脑力劳动和长时间的工作,容易产生视觉疲劳导致误差;海量影像信息容易出现漏诊;全凭医生的经验去鉴定,缺乏量化标准,误诊率高。据统计,美国每年被误诊的人数达到1200万人,中国每年被误诊的人数高达5700万人。中华医学会的一份误诊数据资料显示,中国临床医疗总误诊率为27.8%,其中恶性肿瘤平均误诊率为40%,器官异位误诊率为60%,肝结核、胃结核、肺外结核的平均误诊率也在40%以上。
人工智能可提升影像诊断的精准度主要在于:一是改变阅片方式。直接实现机器自动对片子进行初筛、判断、病灶勾选等,医生只需作最后判断。二是改变阅片速度。人工智能自动快速初筛,并勾选病灶,略过了医生大量烦琐的初筛过程,大大缩短时间。三是人工智能具有稳定性和全面性特点,不受工作时间长短影响,且能做到全域完整观察片子无遗漏,快速稳定地完成初筛、判断,最后由专业医生对关键部位进行复判,阅片的精准度有双重保障。
贝斯以色列女执事医疗中心(BIDMC)与哈佛医学院合作研究的人工智能系统,对乳腺癌病理图片中癌细胞的识别准确率达到92%。虽然低于病理学家96%的准确率,但当这套技术与病理学家的分析结合在一起时,诊断准确率高达99.5%。据悉尼《先驱晨报》的报道,Enlitic公司开发的检测系统凭借深度学习技术超越了4位顶级放射科医生,包括人类医生无法诊断出的7%的癌症,相比较医生60%的癌症误诊率,其误诊率只有47%。
在医学影像分析方面,由于放射科医生的工作效率大大提高,诊断费用也逐步降低。在中国,医学影像识别的准确率已经超过专家的水平,它的普及和推广只是一个时间问题。
智能计算机不仅能帮助诊断、承担放射科医生的工作,还可以进行手术。今天,世界上最有代表性的手术机器人就是达芬奇手术系统。达芬奇手术系统分为两部分:手术室的手术台和医生可以在远程控制的终端。手术台是一个有3~4个机械手臂的机器人,它负责对病人进行手术,机械手臂的灵活性远远超过人类,且带有摄像机可以进入人体内手术,不仅手术的创口非常小,而且能够实施一些人类医生很难完成的手术。在控制终端,计算机可以通过几台摄像机拍摄的二维图像还原人体内高清晰度三维图像,以便监控整个手术过程。医生可以在远程对手术的过程进行人工干预。达芬奇手术系统的主要发明人之一,是约翰·霍普金斯大学的拉塞尔·泰勒(Russell Taylor)教授。截至2019年,“达芬奇”在全球累计参与的手术已达720万台,平均每26秒就帮助一名医生完成一台手术。
相比医生,计算机在诊断和手术方面有三大优势。
一是漏判(或者失误)的可能性非常低,也就是说它们能够发现一些医生忽略的情况。
二是准确率很高,且随着机电技术的进步和手术量的增加提高得非常快。
据泰勒教授介绍,达芬奇手术系统的手术误差在0.02毫米,小于头发丝的直径,远远低于专家的误差,而他正在开发的新一代手术机器人,误差可以降到0.002毫米。再好的医生的手都有微微抖动,而机器人的动作完全没有抖动。
三是这些智能程序的稳定性非常好,不会像人那样受情绪的影响。
除了医疗成本,人们就医难的根本原因还在于医疗资源短缺,特别是欠发达地区。机器智能在解决医疗资源不足的问题上同样有效。
2017年,IBM宣布他们开发的沃森(Watson)智能系统在诊断疑难病方面已经超过了专家水平。为什么计算机在诊断普通疾病上的表现并不比专家出色,但在诊断疑难病方面反而比专家的水平高呢?这是因为医生平时能够遇到大量普通患者,经验较多,而他们一生也见不到几例疑难病,因此经验就显得不足了。但是计算机能够在很短的时间内从各个医院汇集大量的同一种疾病数据,因此它进步的速度远远超过人类医生。
2022年7月,人工智能的一项新成果震撼了整个生物学界。Alpha Fold完成了我们已知的2亿多种蛋白质的所有结构预测,生物学迎来新时代。
氨基酸是蛋白质的基本单位,按照不同的顺序和结构排列形成了人体和生物圈的上亿种蛋白质。如果能知道每一种蛋白质的具体结构,那么展开生物学研究,研发药物和疫苗,就方便多了。
对人类而言,这件事并不容易,破解一种蛋白质可能需要好几个月或几年时间。
Deep Mind公司旗下的Alpha Fold模型帮助我们把这件事彻底完成了——该模型已经公开了我们已知的2亿多种蛋白质的所有结构预测,并建立数据库供科研人员免费使用。现在,查找一个蛋白质的结构如同“百度一下”一样简单。
从名字就可以联想到,它与打败人类最强围棋高手的Alpha Go师出同源,都是Deep Mind的产品。从李世石到柯洁,Alpha Go势如破竹,取得了一场又一场胜利。
引发生物学界地震的Alpha Fold的传奇,也要从一场热烈的比赛说起。
1972年,美国科学家克里斯蒂安·安劳森因蛋白质相关研究获得诺贝尔化学奖。他提出一些法则:对于部分蛋白质来说,只要确定了氨基酸序列,那么就可以预测蛋白质的三维结构,这是我们讨论蛋白质结构预测的基础。
在Alpha Fold横空出世之前,科学家们兢兢业业地用X射线冷冻电镜技术观察蛋白质结构,但效率很低。《科学》杂志2020年数据称,我们靠传统方法确定的蛋白质只有17万种,与已知的2.14亿种氨基酸序列组成的蛋白质相去甚远。
1994年,美国马里兰州大学的约翰·穆尔特和同事一起发起CASP竞赛,旨在比较计算机预测的蛋白质结构和实验室费时费力检验出的准确结果。该比赛两年举行一次,俗称为“蛋白质奥林匹克”。
得分规则很简单:计算机预测的和实验室结果越接近,分数越高,满分为100分,90分以上就可以认定为与实验室结果一致。
预测蛋白质结构有多难,从得分上就可以看出。按理说,2016年,计算机科学的水平已经很高了,但对最具挑战的蛋白质结构预测得分也就只有40分。
直到2018年,Deep Mind带着Alpha Fold来比赛——在最具挑战的蛋白质结构预测中轻松斩获60分,将所有利用其他试验工具的人类对手甩在身后。
可怕的是,比人类有天分的人工智能还比人类更努力。在接下来的两年里,Alpha Fold继续学习已知的蛋白质结构信息,在2020年的比赛中,其在最难的结构预测中斩获87分,得分中值高达92.5分。
这引发了比赛组织者的怀疑:Alpha Fold是不是作弊了?有人漏题了?
于是比赛方把一种古生菌的膜蛋白交给Alpha Fold预测,它的结构谁也不知道。结果是:Alpha Fold迅速完成预测,还帮助研究人员快速得出相匹配的实验室结果。出题裁判安德烈·卢帕斯称,这是困扰研究人员10年的复杂蛋白质结构,终于在人工智能的辅助下有所突破。
赢得比赛当然不是Alpha Fold存在的意义。2021年,Deep Mind公布了超过35万种蛋白质的结构预测,基本包括人类基因组表达的所有蛋白质。2022年7月底,Alpha Fold又给出了2亿多种蛋白质预测,生物界已知的蛋白质,其结构基本宣告破解,迎来了生物学研究新时代。
Deep Mind表示,自2021年推出数据库以来,已有50多万名研究人员使用了该数据库。开发全新的药物和新冠疫苗用得上,探索生命起源时蛋白质的进化,也用得上。
最近一年来,牛津大学的科学家开始通过蛋白质结构数据库来推进对疟疾疫苗的研究。他们关注的是一种名为pfs48/45的疟疾蛋白,但是对这种分子的认识还不太清楚。
现在,研究该问题的研究员拿到了Alpha Fold预测的蛋白质结构,并将其与实验方法得出的分子模糊视图进行比较。两个模型完美地结合在一起,形成了该分子及其工作原理和抗体如何与之结合的清晰图像。
蛋白质结构的作用,不仅仅局限于狭义的生物领域。朴次茅斯大学的结构生物学家约翰·麦基恩教授团队,已经在使用Alpha Fold的数据开发可以更快降解塑料的酶。麦基恩称,Alpha Fold对无法通过实验确定的蛋白质结构的预测,会让他们的研究项目耗时缩短“好几年”。
加利福尼亚大学旧金山分校的研究员韦尔巴博士将其视为教育新一代科学家的一种方式:许多研究人员在结构生物学上并不精通,但涵盖所有已知蛋白质结构的数据库会降低准入。这样,就可以把结构生物学带给大众。