量子机器学习和数据的力量

近年来,量子计算在理论和实践上都取得了快速发展,人们也希望它能在实际应用中发挥潜在影响。一个关键的关注领域是量子计算机如何影响机器学习。我们最近通过实验证明,量子计算机能够自然地解决某些输入之间存在复杂关联的问题,而这些问题对于传统或“经典”计算机来说可能非常困难。这表明,在量子计算机上构建的学习模型对于某些应用可能具有显著的强大功能,可能拥有更快的计算速度、在更少数据上更好的泛化能力,或两者兼而有之。因此,了解在什么情况下可以实现这种“量子优势”是非常有趣的。

量子优势的概念通常以计算优势的形式来表述。也就是说,给定一些具有明确输入和输出的任务,量子计算机能否在相当的运行时间内获得比传统机器更准确的结果?人们怀疑量子计算机在许多算法上具有压倒性的优势,例如用于对大素数乘积进行因式分解的Shor 因式分解算法(与RSA 加密相关)或量子系统的量子模拟。然而,解决问题的难度,以及量子计算机的潜在优势,可能会受到数据可用性的巨大影响。因此,了解量子计算机何时可以帮助机器学习任务不仅取决于任务,还取决于可用的数据,而对此的完整理解必须包括两者。

在《自然通讯》上发表的 《量子机器学习中数据的力量》一文中,我们剖析了机器学习中的量子优势问题,以便更好地了解它何时适用。我们展示了问题的复杂性如何随着数据的可用性而正式变化,以及这有时如何能够提升经典学习模型以与量子算法竞争。然后,我们开发了一种实用的方法来筛选在核方法背景下所选一组数据嵌入何时可能具有量子优势。我们利用从筛选方法和学习界限中获得的见解来引入一种新方法,该方法将量子计算机中特征图的选定方面投影回经典空间。这使我们能够将来自经典机器学习的额外见解注入量子方法,从而显示出迄今为止量子学习优势中最好的经验分离。

数据的计算能力

量子计算机相对于传统计算机的优势通常体现在计算复杂度类别上。诸如因式分解和模拟量子系统等示例被归类为有界量子多项式时间 (BQP) 问题,这些问题被认为比传统系统更容易用量子计算机处理。在传统计算机上容易解决的问题称为有界概率多项式 (BPP) 问题。

我们表明,配备量子过程数据的学习算法(例如聚变或化学反应等自然过程)会形成一类新问题(我们称之为 BPP/Samp),这些问题可以高效执行一些没有数据的传统算法无法完成的任务,并且是可通过多项式大小的建议 (P/poly) 有效解决的问题子类。这表明,对于某些机器学习任务,了解量子优势还需要检查可用数据。

1728749232914.jpg

量子学习优势的几何测试

根据结果,优势的潜力会根据数据的可用性而变化,人们可能会问,从业者如何快速评估他们的问题是否适合量子计算机。为了解决这个问题,我们开发了一个工作流程,用于评估内核学习框架内的优势潜力。我们检查了许多测试,其中最强大和最有启发性的是我们开发的一种新型几何测试。

在量子机器学习方法(例如量子神经网络或量子核方法)中,量子程序通常分为两部分:数据的量子嵌入(使用量子计算机对特征空间进行嵌入映射)和应用于数据嵌入的函数的评估。在量子计算的背景下,量子核方法利用传统的核方法,但使用量子计算机对量子嵌入上的部分或全部核进行评估,量子嵌入的几何形状与经典嵌入不同。据推测,量子嵌入可能产生量子优势,它可能比任何可访问的经典几何形状更适合特定问题。

我们开发了一种快速而严格的测试,可用于快速将特定的量子嵌入、内核和数据集与一系列经典内核进行比较,并评估是否存在量子优势的机会,例如可能的标签函数,例如用于图像识别任务的标签函数。我们定义了一个几何常数g,它根据几何测试量化了理论上可以缩小该差距的数据量。这是一种非常有用的技术,可以根据数据约束来决定量子解决方案是否适合给定的问题。

投影量子核方法

几何测试揭示的一个洞见是,现有的量子核常常受到几何学的影响,这种几何学很容易被经典方法所超越,因为它们鼓励记忆,而不是理解。这启发我们开发了一种投影量子核,其中量子嵌入被投影回经典表示。虽然这种表示仍然很难用经典计算机直接计算,但与完全停留在量子空间中相比,它具有许多实际优势。

1728749202006.jpg

几何量g量化了量子优势的潜力,描绘了几种嵌入,包括此处介绍的投影量子核。

通过选择性地投射回经典空间,我们可以保留量子几何中仍然难以用经典方式模拟的方面,但现在开发距离函数(因此内核)要容易得多,它们在输入的适度变化方面的表现比原始量子内核更好。此外,投影量子内核有助于更好地与经典开发的强大非线性内核(如平方指数)进行集成,这在原生量子空间中更具挑战性。

与之前的方法相比,这种投影量子核具有许多优势,包括提高了描述现有嵌入的非线性函数的能力,减少了处理核所需的资源,使核的数量从二次函数变为线性函数,并且能够在更大的尺寸下更好地概括。该核还有助于扩展几何g,这有助于确保量子优势的最大潜力。

数据集展现出学习优势

几何检验可以量化所有可能的标签函数的潜在优势,但在实践中,我们最感兴趣的往往是特定的标签函数。使用学习理论方法,我们还将泛化误差限制在特定任务的范围内,包括那些最终源于量子的任务。由于量子计算机的优势在于它能够同时使用许多量子比特,但之前的方法在量子比特数量上扩展性较差,因此重要的是在相当大的量子比特大小(> 20)下验证任务,以确保方法具有扩展到实际问题的潜力。在我们的研究中,我们验证了多达 30 个量子比特,这由开源工具TensorFlow-Quantum实现,从而能够扩展到千万亿次计算。

有趣的是,我们表明,当提供足够的数据时,许多自然量子问题(甚至多达 30 个量子位)都可以通过经典学习方法轻松处理。因此,一个结论是,即使对于一些看似量子的问题,由数据赋能的经典机器学习方法也可以与量子计算机的能力相媲美。然而,使用几何构造与投影量子核相结合,我们能够构建一个数据集,该数据集表现出量子模型相对于经典模型的经验学习优势。因此,虽然在自然问题中找到这样的数据集仍然是一个悬而未决的问题,但我们能够证明在这种情况下存在标签函数。虽然这个问题是人为设计的,量子计算优势需要嵌入更大、更具挑战性,但这项工作代表了理解数据在量子机器学习中的作用的重要一步。

1728749187429.jpg

预测准确度与量子比特数 ( n )的关系,该问题旨在最大限度地发挥量子模型的学习优势潜力。数据显示了两种不同大小的训练数据 ( N )。

对于这个问题,我们扩大了量子比特的数量 ( n ),并将投影量子核的预测精度与现有核方法和我们数据集中最好的经典机器学习模型进行了比较。此外,这些结果的一个关键结论是,尽管我们展示了量子计算机具有优势的数据集的存在,但对于许多量子问题,经典学习方法仍然是最佳方法。了解数据如何影响给定问题是讨论学习问题中的量子优势时需要考虑的一个关键因素,而传统计算问题则不考虑这一点。

结论

在考虑量子计算机辅助机器学习的能力时,我们已经表明数据的可用性从根本上改变了这个问题。在我们的工作中,我们开发了一套实用的工具来研究这些问题,并使用它们开发了一种新的投影量子核方法,该方法比现有方法具有许多优势。我们的目标是迄今为止最大的数值演示,即 30 个量子比特,以展示量子嵌入的潜在学习优势。虽然现实世界应用的完整计算优势还有待观察,但这项工作有助于为未来的道路奠定基础。我们鼓励任何感兴趣的读者查看论文和相关的 TensorFlow-Quantum 教程,以便轻松地在此基础上进行构建。

致谢

我们要感谢本文的合著者 Michael Broughton、Masoud Mohseni、Ryan Babbush、Sergio Boixo 和 Hartmut Neven,以及整个Google Quantum AI团队。此外,我们还要感谢 Richard Kueng、John Platt、John Preskill、Thomas Vidick、Nathan Wiebe、Chun-Ju Wu 和 Balint Pato 提供的宝贵帮助和反馈。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论