来源:学术头条 作者:Davide Castelvecchi,我们可以将其称为未来计算的复仇者联盟。将两个科技界最热门的术语——机器学习和量子计算机结合起来,就形成了量子机器学习(quantum machine learning)。就像《复仇者联盟》的漫画书和电影将一群超级英雄集结起来,形成了一个梦幻团队,这一组合很可能会吸引大量关注。但无论在科技还是小说领域,制定一个好的情节都是至关重要的。
如果量子计算机能够以足够大的规模制造出来,那么通过利用亚原子世界的独特属性,它们有望比普通数字电子技术更高效地解决某些问题。多年来,研究人员一直在探究这些问题是否包括机器学习——一种人工智能形式,其中计算机被用于发现数据中的模式,并学习可用于在不熟悉的情况下进行推理的规则。
现在,随着备受瞩目的人工智能系统 ChatGPT 的发布(该系统依靠机器学习,通过推断文本中单词之间的关系来实现类似人类的对话),以及量子计算机的规模和能力的快速增长,这两种技术都在迅猛发展。那么,当两者结合,会产生什么有用的东西吗?,兴趣正不断增长
许多科技公司,包括 Google 和 IBM 等老牌企业以及加利福尼亚伯克利的 Rigetti 和马里兰大学学院公园的 IonQ 等初创公司,都在研究量子机器学习的潜力。学术界的科学家们也对此兴趣浓厚。
位于瑞士日内瓦郊外的欧洲粒子物理实验室欧洲核子研究中心(CERN),已经利用机器学习在大型强子对撞机产生的数据中寻找某些亚原子粒子的迹象。那里的科学家们是正在进行量子机器学习实验的学者群体之一。
CERN 的量子计算和机器学习研究小组组长、物理学家索 Sofia Vallecorsa 说:“我们的想法是利用量子计算机加速或改进传统机器学习模型。”,目前尚未解决的一个重要问题是,在某些场景下,量子机器学习是否会比传统机器学习更具优势。理论表明,对于特定的计算任务,如模拟分子结构或寻找大整数的质因数,量子计算机将加速可能比宇宙的年龄还长的计算过程。但研究人员仍缺乏足够的证据证明这一点适用于机器学习。也有人说,量子机器学习可能会发现传统计算机未发现的模式——即使它的速度并不快。
南非德班的物理学家 Maria Schuld 说,研究人员对量子机器学习的态度摇摆在两个极端之间。尽管研究人员对这种方法兴趣浓厚,但似乎越来越不甘心短期应用前景的渺茫。Schuld 在加拿大多伦多的量子计算公司 Xanadu 工作。
一些研究人员开始将焦点转向将量子机器学习算法应用于本质上是量子的现象。麻省理工学院(MIT)物理学家 Aram Harrow 表示,在所有量子机器学习的提议应用中,这是“一个量子优势相当明显的领域”。
量子算法能凑效吗?
过去 20 年来,量子计算研究人员们开发了大量的量子算法,这些算法理论上可以使机器学习更为高效。在 2008 年的一项开创性研究中,Harrow 与 MIT 物理学家 Seth Lloyd 和 Avinatan Hassidim(现就职于以色列拉马特甘的巴伊兰大学)共同发明了一种量子算法,该算法在解决机器学习核心挑战之一的大型线性方程组方面,比传统计算机快得多。
但在某些情况下,量子算法并未实现其预期的效果。一个广为人知的例子发生在 2018 年,计算机科学家 Ewin Tang 发现的一种方法,可以击败 2016 年设计的一种量子机器学习算法。该量子算法旨在提供互联网购物公司和 Netflix 等服务公司根据客户之前的选择向客户提供的建议类型——并且在做出这类推荐时比任何已知的传统算法快得多。
当时,只有 18 岁的本科生 Tang 编写了一个几乎同样快速的算法,但该算法可以在传统计算机上运行。德克萨斯大学奥斯汀分校量子计算研究员 Scott Aaronson 是 Tang 的指导老师,他表示,量子推荐算法是一个罕见的例子,它似乎在实际问题中提供了显著的速度提升,因此她的工作“使得实际机器学习问题中的量子速度指数级提升的目标比以前更加遥不可及”。Tang 说,她仍然对任何有关机器学习中量子速度大幅提升的说法持“相当怀疑的态度”。
一个潜在的更大问题是,传统数据与量子计算并不总是能很好地结合在一起。大致来说,一个典型的量子计算应用有三个主要步骤。首先,量子计算机初始化,这意味着其各个内存单元(称为量子位或量子比特)将被置于一种集体纠缠的量子态。接下来,计算机执行一系列操作,即经典比特逻辑运算的量子类似操作。在第三步中,计算机执行读出操作,例如测量携带关于量子运算结果信息的单个量子位的状态,这可能是指示机器内部的某个电子是顺时针还是逆时针旋转等。
就像“最细的吸管”
Harrow、Hassidim 和 Lloyd 等人提出的算法有望加快上述“第二步”。但在许多应用中,第一步和第三步可能极其缓慢,从而抵消了这些优势。初始化步骤需要将“经典”数据加载到量子计算机上,并将其转换为量子态,这通常是一个低效的过程。而且,由于量子物理本质上是概率性的,读取过程常常带有随机性,因此,量子计算机必须多次重复所有三个阶段,并对结果求取平均值,从而得出最终答案。
华盛顿大学西雅图分校的量子计算研究员 Nathan Wiebe 表示,一旦量子化数据被处理成最终的量子态,取出答案也可能需要很长时间。他在 10 月份的一个量子机器学习研讨会上说:“我们只能从最细的吸管中吸取信息。”,“当你问几乎任何研究员量子计算机擅长什么应用时,答案是,‘可能,并不是经典数据,’”Schuld 表示,“到目前为止,没有真正的理由相信经典数据需要量子效应。”,Vallecorsa 和其他人表示,速度并不是评估量子算法的唯一标准。还有迹象表明,由机器学习驱动的量子人工智能系统或许能学会识别经典算法会遗漏的数据模式。
这可能是因为量子纠缠在量子位之间建立了相关性,因此也在数据点之间建立了相关性,德国 Zeuthen 的 DESY 粒子物理实验室的物理学家 Karl Jansen 说,“我们希望能够检测到在数据中很难被经典算法检测到的相关性。”,但 Aaronson 持不同意见。量子计算机遵循已知的物理定律,因此它们的运作和量子算法的结果完全可以由一个普通计算机在足够时间内预测。“因此,唯一值得关注的问题是,量子计算机是否比完美的经典模拟更快,”Aaronson 说。
根本性量子变革
还有一种可能性,就是完全避开转换经典数据的障碍,通过在原本就是量子的数据上使用量子机器学习算法。
在整个量子物理学历史中,量子现象的测量一直被定义为使用一种生活在宏观、经典世界的仪器来进行数值读取。但现在有一种新兴的想法,涉及一种被称为量子传感的新兴技术,使得系统的量子属性通过纯量子仪器来测量。将这些量子态直接加载到量子计算机的量子位上,然后可以使用量子机器学习来识别模式,而无需与经典系统进行任何连接。
麻省理工学院物理学家、谷歌研究员 Hsin-Yuan Huang 表示,在机器学习方面,这可能比收集量子测量作为经典数据点的系统更具优势,“我们的世界本质上是量子力学的。如果你想要一台可以学习的量子机器,它可能会更加强大。”,Huang 和他的合作者在谷歌的一台 Sycamore 量子计算机上进行了一个原理验证实验。他们将部分量子位用于模拟一种抽象材料的行为。然后,处理器的另一部分利用这些量子位的信息,并通过量子机器学习进行分析。研究人员发现,这种技术比经典的测量和数据分析快得多。
它是一种超导体吗?
Huang 表示,完全在量子世界中进行数据的收集与分析,可以让物理学家解决那些只能通过经典测量方法间接回答的问题。例如,一个特定材料是否处于一种特殊的量子态,从而使其成为超导体(能够以几乎为零的电阻导电)。经典实验要求物理学家间接证明超导性,例如测试材料对磁场的反应。
粒子物理学家也在研究使用量子传感技术来处理未来粒子对撞机产生的数据,如在 DESY 的 LUXE 实验中,将电子和光子相撞,Jensen 说。尽管这一想法至少还有十年的时间才能实现,他补充道。彼此相距遥远的天文观测站也可能使用量子传感器来收集数据,并通过未来的“量子互联网”将它们传输到中央实验室,由量子计算机进行处理。人们希望,这能使得捕捉的图像具有前所未有的清晰度。
如果这类量子传感应用被证明是成功的,那么量子机器学习可能会在结合这些实验的测量结果和分析得出的量子数据中发挥作用。
最终,量子计算机是否会为机器学习带来优势,将通过实验而非数学证明来决定。“我们不能期待所有东西都像我们在理论计算机科学中那样被证明,”Harrow 说。
“我当然认为量子机器学习仍然值得研究,”Aaronson 说,无论是否最终提高效率。Schuld 同意这一说法。“我们需要在不受证明速度提升的限制下进行研究,至少目前是这样的。”,