



不同波长的电磁波会在物质内部引起电子跃迁、分子振动等变化,使得物质可以释放出各种响应信号;通过记录和分析这些信号,人们就可以知晓物质与电磁波的相互作用,并借此分析物质的结构、成分等性质,这一技术被称为波谱分析。从牛顿开始,波谱分析一直都是人类探索物质微观结构、发现物质规律乃至进行星际探索 [5] 的重要手段。比如,X射线的波长与材料的原子间距相仿,因此会在材料原子间发生衍射,借助其衍射光谱可以帮助我们了解材料的微观结构;紫外-可见光波段的电磁辐射可以引起电子系统的跃迁,得到的相应吸收光谱反映了物质的电子结构;红外光波段的电磁波频率与分子和材料的振动频率接近,由此发展而来的拉曼光谱和红外吸收光谱可以准确反映物质的振动信息,可用于物质种类鉴别和含量分析;更远波段的无线电波则与原子核跃迁的能量接近,基于此原理发展而来的核磁共振成像技术可以分辨原子的化学环境,在成分分析、医疗诊断上应用广泛(图1-6)。
图1-6 常见的波谱分析技术
然而,由于在光谱测量中普遍存在信息降维或复杂耦合等过程,传统的光谱解读方法非常依赖于研究人员的经验,人力和时间成本高,效率低。另外,解谱的目的是利用某种规则,将每组信号峰归属到微观的结构或过程,这就意味着研究人员需要对每组信号都做一次相似的分析,因此解谱也是一种重复性的劳动。以研究蛋白质结构为例,核磁共振技术可以在几分钟内完成活体细胞内蛋白质结构和构型变化的测定,并给出核磁共振谱;然而,研究人员却要花上几周乃至几个月的时间,才能从谱学结果中逆向解析出蛋白质的结构,可谓是“实验五分钟,解谱半年功”。因此发展一种高效快速的解谱方法,已经成为学术界和产业界的共同目标。
如果将光谱解读与计算机科学中的人脸识别进行对比,我们会发现两者的任务类型非常相似:二者都是根据输入的几个信号特征,精确匹配特定对象。这就意味着,人工智能技术在光谱解读中将大有可为。韩国世宗大学的研究团队通过将X射线衍射(X-ray diffraction,XRD)光谱的分立信号理解为图片形式的连续信号,利用卷积神经网络(convolutional neural network,CNN)从1 785 405组四元化合物的XRD数据中,成功训练出可以识别晶相和组分含量的机器学习模型 [6] ;此外,卷积神经网络还可以实现对晶体晶型的快速识别,准确率超过90% [7] (图1-7)。
人工智能与波谱分析的结合,为未来的生物和医疗诊断提供了新方案。在过去,肿瘤的病理分析通常都需要进行有创手术和活检,会给患者带来额外的痛苦;对于某些长在脆弱器官上的肿瘤,手术等手段更是无能为力。现在,人工智能和拉曼光谱检测技术的结合,为我们提供了无创、快速、准确的肿瘤检测方案。温州医科大学的研究团队收集了健康人群和大量肝癌患者的体外拉曼光谱数据,基于此训练了卷积神经网络模型,并根据实际的病理分析结果对训练过程进行修正,使得该模型达到了预期目的:通过分析患者的体外无创拉曼光谱数据,程序便能实时分析出肝部的肿瘤类型、肿瘤发展阶段等病理结果 [8] (图1-8)。随着数据量的增加和技术的发展,这一技术可以方便地迁移到对其他疾病的鉴别上,从而促进相关疾病检测的发展与变革。
图1-7 机器学习识谱辨别物质结构
人工智能技术正在波谱分析中引领新一轮的研究模式变革,相关的研究成果甚至已经来到了大众身边。但在人工智能技术取得巨大成就的同时,我们也需要认识到,当前的人工智能仍然处在“弱人工智能”阶段,在未来还需要有更多的发展和完善。尽管现在的人工智能技术能够大幅提高光谱解析的效率,但技术本身也受到训练数据质量、模型自身不足的限制,在当下仅能在有限的专业领域中发挥工具属性,作为人类智力的有力延伸。随着人工智能模型的完善和数据质量、数量的上升,未来的人工智能技术将具备更多、更强大的功能,成为波谱分析中的强有力工具。
图1-8 卷积神经网络赋能肝部肿瘤无创拉曼检测