美国洛斯阿拉莫斯国家实验室和伦敦大学的研究人员构建了一个不存在高原的特定量子神经网络架构

最近,来自洛斯阿拉莫斯国家实验室 (LANL) 和伦敦大学的研究人员构建了一个没有贫瘠高原的特定量子神经网络架构。这篇研究论文的标题是“在量子卷积神经网络中不存在贫瘠高原”。标题发表在《PHYSICAL REVIEW X》杂志上。

运行在量子计算机上的卷积神经网络因其比传统计算机更好地分析量子数据的能力而引起了很多关注。一个被称为“贫瘠高原”的基本可解性问题将神经网络的应用限制在大型数据集上。最近,来自洛斯阿拉莫斯国家实验室 (LANL) 和伦敦大学的研究人员构建了一个没有贫瘠高原的特定量子神经网络架构。这篇研究论文的标题是“在量子卷积神经网络中不存在贫瘠高原”。标题发表在《PHYSICAL REVIEW X》杂志上。

量子神经网络被认为是最有前途的架构之一,其应用包括物理模拟、优化和更通用的机器学习任务。尽管量子神经网络具有巨大的潜力,但其中许多架构已被证明存在贫瘠的高原,其中量子计算机中的比特数很大,成本函数的梯度随着系统的大小呈指数级消失。有效的培训是不可能的。这是机器学习优化算法中出现的可训练性问题,算法无法在没有特征的景观中找到向下的斜坡,也没有明确的最小能量路径。通常的方法是不断优化并查看它是否有效,这常常使研究人员处于筋疲力尽的状态。

“我们已经通过实验证明,特定类别的量子神经网络没有贫瘠的高原。这种结构确保了可训练性,这意味着可以普遍调整参数。” 洛斯阿拉莫斯国家实验室专门研究量子计算和量子机器学习,量子信息物理学家 Marco Cerezo 这么说。作为一套人工智能方法论,量子卷积神经网络由视觉皮层生成,涉及一系列卷积或过滤层,与池化层交错,以缩小数据范围,同时保持数据集。特征。

这些神经网络可用于解决从图像识别到材料探索的一系列问题。克服贫瘠高原的问题对量子计算机在AI(人工智能)中的应用潜力起到决定性的作用,同时也证明了量子计算机相对于传统计算机的巨大优势。Cerezo 说,到目前为止,量子机器学习领域的专家一直在研究如何减少贫瘠高原的影响,但没有避免这种现象的理论依据。这一次,美国洛斯阿拉莫斯实验室的结果表明,一些量子神经网络实际上可以免疫贫瘠高原现象。

“通过这项工作,研究人员现在能够筛选量子计算机数据以获取有关量子系统的信息,并将该信息应用于研究材料特性或为其他应用挖掘新材料。” 洛斯阿拉莫斯大学的量子物理学 J. Patrick Coles 认为。他表示,研究人员使用当今的量子计算机越多,就会出现越多的量子人工智能算法,并产生越来越多的数据——所有机器算法程序都需要大数据流量。

图片[1]-美国洛斯阿拉莫斯国家实验室和伦敦大学的研究人员构建了一个不存在高原的特定量子神经网络架构-老王博客

避免消失梯度

“如果有一个贫瘠的高原,所有量子加速或主导的希望都将破灭,”塞雷佐说。这个问题的症结在于最优场景中的“梯度消失”。梯度消失是因为在微分中链式方法带来的梯度反向传播中的乘法效应,当网络层太深时会导致梯度消失问题。在这项工作中,研究人员严格分析了量子卷积神经网络架构中参数的梯度缩放。事实证明,梯度的方差消失的速度并不比多项式快,这意味着量子卷积神经网络中不存在贫瘠的高原。

对于卷积神经网络,比较是通过将图像分成几块来进行的,比较的“小块”称为特征。在两张图像中大致相同的位置找到一些粗略的特征进行匹配。与传统的将整幅图像一一比较的方法相比神经网络参数初始化,卷积神经网络可以更好地看出两幅图像的相似性。在网络优化过程中,会出现梯度消失或梯度爆炸等现象。卷积操作通过将图像分成小块来提取局部相关的特征神经网络参数初始化,使其能够学习到合适的特征。卷积神经网络的流行很大程度上是由于它们能够提取层次特征。

实验场景包括丘陵和河谷。其目的是通过探索场景的地形特征,针对模型的参数,找到最终的结果。这个结果通常是在最低山的底部。然而,在平面场景中,研究人员无法校准参数,因为难以确定方向。当数据特征的数量增加时,这个问题变得特别精确。当贫瘠高原出现时,量子神经网络无法扩展。洛斯阿拉莫斯实验室开发了一种用于分析量子神经网络中比例的新型绘图方法,并证明了其可训练性。

在过去的 40 年里,物理学家一直在努力证明量子计算机在模拟和理解粒子的量子系统以及抑制传统计算机的发展方面非常有效。这一次,在洛斯阿拉莫斯的研究中,证明了稳定的量子卷积神经网络将有效地应用于分析量子模拟数据。“目前,量子机器学习的技术还不成熟。” Coles 认为,“当激光器刚被发现的时候,有很多问题和疑惑,但现在激光技术的应用已经很普遍了。同样,现在很多人都在猜测,未来量子信息将唾手可得,量子机器学习将发展迅速。”

例如,研究人员一直在使用陶瓷材料作为高温超导体,因为它们能够改善磁悬浮列车等无摩擦运输。然而,在对材料的大相数据集进行分析时,会受到材料的温度、压力和杂质的影响,大相数据集的分类是一个巨大的工程,远远超出了传统计算机的能力。范围。使用可扩展的量子神经网络,量子计算机可以筛选已知材料不同状态的大型数据集,并将这些状态与不同的量相关联,以确认最近的高温超导状态。

本文发表于《中国民商》杂志2022-01期

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论