追溯当今文明的起源,技术进步中总是伴随着计算工具的革新。无论是出现在中西方早期文明中的易学术数和神秘学占星术,还是近代欧洲数学家发明的乘法计算机机械装置,都能看到借用可观测、可控的自然系统的规律演化来推演那个时代生活里的大小事情。小到计算时间,大到部落战争,或是生产制造,可触及的角落不缺算术和计算工具的影子。
21世纪以来,科技的发展大步迈入信息时代新技术革命的巅峰,人工智能是涌现出的众多新兴科技中最让人兴奋的,引人无限遐思。过去十年,卷积神经网络在图像分类上的成功应用使深度学习进入人们的视野,生成对抗网络的提出又再次扩展了大家对人工智能处理边界问题的认识,深度强化学习模型AlphaGo系列在同专业棋手博弈中的胜利更是使人工智能成为目前社会最流行的科技词汇之一 [1] 。在那之后,AI技术席卷各个交叉领域,不但被用于自动驾驶、设计新药物新材料、交通规划、金融交易等领域,GPT-3和AlphaFold更是在自然语言处理和类似数据场景下取得了成功并已经颠覆了特定技术行业。这其中也有新提出的Transformer模型和注意力机制发挥作用,而这两者的潜在应用将不只局限在传统自然语言处理任务。
随着经济社会生活信息化程度的不断提高,海量用户数据及多样性的需求都在以超越指数的方式在迭代,这些是人工智能的温床,却导致了支撑这一大厦的底层基石——经典电子比特受到挑战。在过去这些年,集成电路芯片提供的算力一直随着半导体制造工艺的提升以摩尔定律不断迭代。0-1电子比特需要通过电子能量的控制确定性区分半导体器件的不同状态,随着三星和台积电等先进半导体企业的制造工艺进入1nm及以下,制造工艺和芯片运行的能耗提升,更为重要的是,原子半径通常在埃(1/10nm)的尺度下,当制造工艺接近原子半径极限时,量子效应将发挥关键作用,挑战经典物理运行规律,0-1不再是确定性保持的经典数字信号,反而会转换为纠缠在一起的量子态的线性叠加。
量子物理诞生于20世纪,是举世瞩目众多科学家集体智慧的结晶。大自然的微观物理机制被进一步揭示,经过多次科学论证,量子理论成为当代物理学的基础之一。“二战”后大量优秀科学家在美国汇集,其中犹太裔天才物理学家费曼在一次报告中最早提出,用量子物理演化过程模拟目标物理系统的思想,这被广泛认为是量子计算的原型。量子比特作为高维布洛赫球面上的态向量,在希尔伯特空间下产生了更强的针对数据信息的表示能力,通过量子态在包含可控参数下的演化实行量子程序的高度并行。在某些问题上,遵循量子规律对信息进行计算处理,即使用量子计算机,将拥有远超经典计算机的表现。量子计算真正广为人知是在Shor提出质因数分解算法之后,Shor质因数分解算法相比经典算法的指数加速及其在密码学上广泛而重大的现实意义,使该算法的提出成为量子计算的里程碑 [1] 。
量子计算机的基础理论早已成熟,并基于计算机体系架构发展了一系列的编程和量子软件编译工具。近年来以中国科学技术大学团队“九章”系列量子计算机、IBM和谷歌公司的超导量子计算机为代表,使量子计算逐渐进入大众视野。理性看待量子计算展现的量子计算优势,并比较不同物理实现目前的局限性,能够更好地深挖有潜力的技术路线。
当前主流量子计算机均采用量子线路模型,量子线路的核心是量子比特(qubit)与量子门(Quantum Gate)的设计与执行。人们研究了许多可能作为量子计算载体的物理系统,如超导线路、离子阱、光晶格、固态自旋、量子点、腔量子电动力学系统、线性光学系统等,但截至目前,超导体系是较成功并广为接受的量子计算物理体系,紧追其后的则是展现了高保真度门操作、较大线路深度的离子阱系统。在量子计算机的硬件实现层面,超导体系与离子阱体系走在了前面。
目前量子计算机硬件已进入NISQ(Noisy Intermediate Scale Quantum)时代,即无检错纠错、中等尺寸(几十个量子比特)的量子计算机,但NISQ距离实际应用尚有距离,使用量子计算机解决实际问题所要求的线路深度,相较于当前量子门的保真度而言,仍显得太大。当前各个物理体系两比特门的保真度勉强做到大于99%,这意味着,倘若需要处理一个实际问题,线路深度将导致量子门的误差逐层累计,最终导致结果的正确率低得不可接受。以谷歌公司2019年演示“量子霸权”的悬铃木量子计算机为例,该超导体系的量子计算机以小于1%的两比特门错误率执行深度为20的量子线路,最终结果的正确率不到五百分之一。谷歌公司的科研人员必须重复运行线路数百万次以获取结果的统计分布,才能从中统计出正确结果。
首先,量子计算机面临的最大问题是退相干(Decoherence),即环境噪声与量子比特的耦合。相干时间(Coherence Time)是衡量一个物理系统抵抗外界噪声的能力,即系统中的量子比特在噪声影响下退相干之前能维持多长时间。相干时间与量子门执行耗时的比值,直接决定了量子门线路的深度规模。其次,还需要考虑量子门操作的保真度,一般来讲,单比特门保真度大于两比特门保真度,技术层面需要关心的往往是两比特门保真度,下文的保真度默认为两比特门保真度。由于量子门误差随着线路深度的累积,当给定了最终结果的正确率要求时,量子线路深度越大,对门的保真度的要求就越高;或者说,门的保真度越低,能执行的线路深度就越小。量子门操作的保真度和最终结果的正确率要求间接地限制了量子门线路的深度规模。最后,也是最基本的技术问题——量子比特的可扩展性,即最多能制备多少个全连接或至少邻近连接的量子比特,这里所谓的“量子比特的连接”是指能在这两个量子比特之间执行两比特门。综上所述,接下来将从可扩展性、相干时间、量子门保真度、量子门执行耗时这几方面衡量几个主流的量子计算物理体系。
(1)超导体系:作为当前最流行的实现方案之一,IBM和谷歌公司已经分别实现了65量子比特和54量子比特的超导量子计算机,如图1-1所示。中国科学技术大学团队也实现了66量子比特超导量子计算机,如图1-2所示。为了减少环境噪声,超导体系必须借助稀释制冷机将超导线路的环境温度冷却到约20mK [2] ,其相干时间为50~200μs [3] ,门操作的执行耗时为10~50ns,保真度最高可达99.4% [4] 。谷歌的54量子比特超导量子计算机只能在阵列中相邻量子比特之间执行两比特门 [4] ,属于最近邻连接的结构,在邻近连接的意义上可扩展性很好。
图1-1 封装好的谷歌悬铃木54量子比特超导量子计算机
图1-2 祖冲之号66量子比特超导量子计算机
(2)离子阱体系:美国IonQ公司和奥地利AQT公司分别实现了79量子比特和20量子比特的离子阱量子计算机。离子,如钙离子 40 Ca + ,以一维离子链的形式被束缚在线性Paul势阱中,将每个离子外层价电子的两个长寿命态组成一个量子比特,这种量子比特的相干时间约为50s。借助离子振动模式之间耦合,以约99.9%的保真度实现任意两个量子比特之间的两比特操作,耗时为3~50μs,但这种全连接两比特门只在离子链长度不太长时成立。
(3)硅量子比特:也称为半导体量子点体系,建立在已经高度成熟的CMOS半导体技术基础上,目前实验上实现了简单的两比特体系,相干时间可达秒量级 [6] ,并且实现了保真度约为90%,耗时约为800ps的快速两比特交换门 [5] 。得益于半导体领域成熟的微纳制造技术,半导体量子比特有着极佳的扩展性,但在门的保真度方面仍需进一步探索。
(4)光量子体系:利用光子作为量子比特,光子天然适合用于量子信息处理,因光子难以与其他粒子耦合,并且便于远距离传输,而集成光子学技术使光量子体系具有更好的可扩展性,目前已成功在硅基光量子集成线路中实现了保真度98%的受控非门 [7] ,但文献 [7] 中的方案需要的分束器、移相器数目会随着量子比特数呈指数增长,因此只适用于中小规模量子线路。虽然光子自身的性质带来了更长的相干时间,但代价是光量子体系的两比特门难以实现,往往要借助光学非线性晶体或者采用辅助光子测量后选择的方案,而非线性晶体对光子的吸收是损害保真度的一大因素,采用测量后选择方案又需要大量的辅助光子。最后,现有技术下的单光子探测器量子效率并不算高,这将降低量子信息的读出成功率。综合看来,光量子体系仍有许多技术难题亟待解决。
(5)拓扑量子计算体系:尚停留在理论层面,由于理论结果显示了其强大的抗干扰能力,预计量子门操作保真度可达约99.9999%,人们一直在寻找合适的物理系统以实现拓扑量子计算,其中马约拉纳费米子是有望率先实现该理论方案的体系。
展望未来几十年,一方面,量子计算的发展目标将是依托各种技术进步,发展量子检错纠错、抗干扰技术,逐步实现容错量子计算(FTQC),这个过程可能会十分漫长,甚至耗费数十年;另一方面,也将在现有技术水平的限制下,努力寻找量子计算的应用场景,让NISQ量子计算机也能最大化地发挥作用。
HHL算法(以3位算法发明人Harrow、Hassidim与Lloyd命名)致力于利用量子信息处理的方式求解 Ax = b 形式的方程。求解同样的问题,已知最优的经典算法复杂度为 O ( N log N ),而HHL算法将问题映射到量子态空间 A | x 〉=| b 〉形式的方程,仅需要 O ((log N ) 2 )步的量子操作。HHL算法的核心思想是构建演化算子e i At ,作用于| b 〉,随后结合量子相位估计算法,提取 A 的特征值信息。再通过受控旋转门,将特征值编码到辅助量子比特中,最后使用相位估计逆变换得到| x 〉。
除了在机器学习中直接应用量子算法,使用参数化量子线路(Parameterized Quantum Circuit,PQC)代替传统神经网络、进行监督学习是近年来又一大发展方向。人们相信传统的神经网络结构结合大量训练数据,能够拟合任意的映射关系。同时,人们发现简单的量子线路可以产生极其复杂的输出 [8] ,那么简单的量子线路是否有足够的复杂度拟合任意的映射关系呢?参数化量子线路因此被提出。
“量子神经网络”一词越来越多地用于指代变分或参数化的量子线路。虽然在数学上与神经网络的内部工作原理有很大不同,但这个类比突出了线路中量子门的“模块化”性质,以及在参数化量子线路的优化中广泛使用的经典训练神经网络的技巧。
典型的参数化量子线路由三部分组成,即编码线路模块、变分线路模块与测量模块。编码线路模块负责将训练集输入的数据编码到量子态中,有两种编码方式:一是概率幅编码(Amplitude Encoding),即将一组数据归一化为{
x
j
},然后制备
,优点是
n
个量子比特可以编码2
n
个输入数据,适合输入信息很多时使用;缺点是制备|
φ
x
〉的量子线路较复杂,并且无法学习关于
x
j
的非线性映射。二是动力学编码(Dynamic Encoding),又叫哈密顿编码(Hamiltonian Encoding),即将输入的数据编码到量子比特的动力学演化过程中,演化算子作用于初始态,进而把数据编码到量子态上。优点是量子线路简单,可以学习非线性映射;缺点是所需的量子比特数往往正比于输入数据的维度,在输入数据维度很大时不适合使用。
变分线路模块包含了所有待训练参数,一个线路的表达能力和纠缠能力很大程度上依赖于变分线路的结构。变分线路的典型结构是一个单比特旋转层加若干纠缠层,纠缠层使用固定结构的两比特门和参数化的单比特门在不同量子比特之间生成复杂纠缠。变分线路的参数数量一般不超过 O ( n 2 L ), L 为纠缠层层数, n 为量子比特数,这些参数自然不可能执行2 n 维希尔伯特空间的任意酉变换。希望在有限的参数下,线路的酉变换可以近似任意酉变换,输出的末态可以近似任意量子态,这是所谓的线路表达能力。
最后,选择一个合适的力学量,将力学量期望值作为模型预测。考虑到不同力学量的本征基底可以用一个酉变换互相转换而本征值不变,力学量的本征值则直接决定了期望值的上限,所以在选择合适的力学量时,要注意选择合适的力学量本征值,使模型预测值与标签值范围匹配。
以上简单描述了典型的参数化量子线路的结构。相比于传统的神经网络监督学习,参数化量子线路展现了参数数量小、抗干扰能力强、训练收敛速度快、不容易过拟合等诸多优点。由此可见,除了寻找指数加速的量子算法,即使规模不大的量子线路,也能在机器学习中发挥价值。
目前量子计算与人工智能的结合受限于硬件技术,只能以小规模、模块嵌入的方式辅助机器学习。人们希望随着量子计算技术的进步,有朝一日能够直接在通用量子计算机上完整地进行人工智能模型算法的设计、实施。相信到那时,量子计算机指数级加速的威力将被完全发挥出来。
量子神经网络(参数化量子线路)与经典神经网络一样可以进行学习,一种显而易见的做法是将它们融合。混合了量子神经网络的经典深度学习算法往往具有更少的参数,并且在学习过程中能更快地收敛至稳定状态。
Deep Quantum框架按照这一逻辑对当前各个领域最先进的深度学习算法进行了优化,融入了量子神经网络模块。在自然语言处理(NLP)领域,经典门控循环单元(Gated Recurrent Unit,GRU)的线性变换层被参数化量子线路替代,Transformer的打分、加权、求和机制已经使用参数化量子线路实现。在计算机视觉领域,经典的循环神经网络(CNN)中的卷积核也可以由量子线路近似;经典生成对抗网络(GAN)中的判别器被参数化量子线路替换,使GAN的训练更加稳定。在材料领域,强化学习环境的搭建需要考虑量子效应,量子强化学习可以很好地解决这一问题。
本书将给出一些生物医药、新材料领域量子人工智能融合算法的具体应用。2019年年末新型冠状病毒感染疫情爆发,大大阻碍了经济的发展,影响了每个人的生活。量子GAN可以识别病毒变异位点,预测病毒变异方向,做到未雨绸缪。同时,量子GRU能够有效地捕获病毒RNA序列的依赖关系,为制造易储存、易运输的mRNA疫苗提供指导。上班族每天工作非常忙碌,加上生活的压力也很大,出现焦虑也是比较常见的,因为这些问题导致的睡眠质量不好,会严重影响身体健康。基于量子Transformer的模型可以被用来处理睡眠产生的脑电图和心电图,准确预测深度睡眠时长,提高睡眠质量。量子卷积网络可以分析医疗图像数据,减轻医生的负担,降低看病成本。偶然发现的青霉素在二战期间立下了赫赫战功,将大量伤员从死亡线上拉了回来。量子人工智能可以大大加快新药物的发现,使人类不再依靠运气发现药物。在医药研发产业链条中最重要的一个环节是确定药物分子蛋白质靶点之间的结合位点及亲和力。量子Transformer、量子卷积网络和量子对抗自编码器都可以被应用在亲和力预测任务上。
采用1h癫痫数据对量子Transformer和经典Transformer进行测试,对比如图1-3所示。
图1-3 量子Transformer和经典Transformer对比
对比量子Transformer和经典Transformer,在运行时间上,量子Transformer在25s左右loss收敛平稳,经典Transformer在260s左右loss收敛平稳,量子Transformer比经典Transformer加速了10倍多。
[1] SILVER D, et al. Mastering the Game of Go with Deep Neural Networks and Tree Search[J]. Nature, 2016, 529:484-489.
[2] DEVORET M H, MARTINIS J H. Implementing Qubits with Superconducting Integrated Circuits[J]. Experimental Aspects of Quantum Computing, 2005:163-203.
[3] KELLY J, et al. State Preservation by Repetitive Error Detection in a Superconducting Quantum Circuit[J]. Nature, 2015, 519:66-69.
[4] ARUTE F, et al. Quantum Supremacy Using a Programmable Superconducting Processor[J]. Nature, 2019, 574:505-510.
[5] HE Y, et al. A Two-qubit Gate Between Phosphorus Donor Electrons in Silicon[J]. Nature, 2019, 571:371-375.
[6] KANE B E. A Silicon-based Nuclear Spin Quantum Computer[J]. Nature, 1998, 393:133-137.
[7] QIANG X, etal. Large-scaleSiliconQuantumPhotonicsImplementingArbitraryTwo-qubit Processing[J]. Nature Photonics, 2018, 12(9):534-539.
[8] MICHAEL J B, ASHLEYM, etal. Achieving Quantum Supremacy with Sparse and Noisy Commuting Quantum Computations[J]. Quantum, 2017, 1:8.