人工智能设计出了人类无法理解的量子实验

北京时间 7 月 19 日消息,量子物理学家马里奥・克莱恩至今还记得自己 2016 年初在维也纳的一家咖啡馆里翻阅 MELVIN 的计算结果时的情景。MELVIN 是克雷恩创建的一套机器学习算法,属于一种人工智能。它的任务是将各种标准量子实验的基础模块进行混合和比对,借此寻找新问题的解决方法。克雷恩发现,MELVIN 的确做出了许多有趣的发现,但其中有一条却令他摸不着头脑。

“当时我的第一反应是,‘我的程序一定出 BUG 了’,因为这个解法根本不可能存在。”MELVIN 似乎是想通过创造多光子的复杂纠缠态来解决问题。问题在于,克雷恩、安东・塞林格和同事们并未给 MELVIN 提供创造这类复杂量子态所需的规则,但 MELVIN 却自己找到了解决之道。最终克雷恩意识到,这套算法发现的其实是上世纪 90 年代初设计的一套实验安排,不过当初那套实验要简单得多,MELVIN 解决的问题则远比它复杂。

“我们明白了这是怎么一回事之后,便立即对这个解法进行了归纳和泛化。”克雷恩表示。自此之后,其他团队也开展了一些 MELVIN 设计的新实验,以全新的方法测试量子力学的理论基础。与此同时,克雷恩从维也纳大学跳槽到了多伦多大学,和新同事一起改进了他们的机器学习算法。他们最近研发了一套名叫 THESEUS 的人工智能系统,不仅计算速度比 MELVIN 快好几个数量级,而且计算结果对人类一目了然。MELVIN 的计算结果需要克雷恩和同事们花费数天、甚至数天时间去理解,但 THESEUS 的计算结果则几乎一眼自明。

克雷恩接触到这个研究项目其实纯属偶然。当时他和同事们想弄清,如何通过实验创造光子的量子纠缠态:当两个光子发生相互作用时,便会形成“纠缠”关系,牵涉其中的两个光子都只能通过同一种量子状态进行数学描述。如果你对其中一个光子的状态进行测量,即使两个光子远隔千里,测量结果也能与另一个光子相吻合(因此爱因斯坦称之为“幽灵般的纠缠关系”)。

1989 年,丹尼尔・格林伯格、迈克尔・霍恩和塞林格三名物理学家对一种名叫 GHZ(三人姓氏首字母的结合)的量子态进行了描述。GHZ 量子态涉及到四个光子,每个光子都处于 0 或 1 两种状态的叠加态上(这种量子态名叫量子比特)。在三人发表的论文中,GHZ 状态包含四个相互纠缠的量子比特,整个系统处于一种二维的量子叠加态中,要么为 0000,要么为 1111。如果对其中一个光子进行测量,发现其处于状态 0 上,整个叠加态便会坍缩,其它光子的状态也是 0;测出的结果为 1 也是同理。上世纪 90 年代末,塞林格和同事们首次在实验中观察到了三个量子比特的 GHZ 态。

克雷恩和同事们还想观察到更高维度的 GHZ 态。他们想使用三个光子,每个都有三个维度,即可以处于 0、1、2 三种状态的叠加态上。这种量子态名叫“三维量子比特。克雷恩团队想寻找的便是一种三维 GHZ 态,处于 000、111 和 222 三种状态的叠加态上。这种量子态可以大大增强量子通信的安全性、以及量子计算的速度。2013 年末,研究人员花了数周时间设计实验和开展计算,试图通过实验创造出所需的量子态,但每次都以失败告终。克雷恩表示:“我当时简直要抓狂了,为什么我们就是找不到正确的实验设置呢?”

为加速研究进程,克雷恩先是编写了一套计算机程序,可以根据实验设置计算出实验结果,然后对程序进行了升级,将光学实验台上用来生成和操控光子的基础模块整合了进去,包括激光、非线性光学晶体、分光器、移项器、全息图等等。这套程序将这些模块进行随机混合和匹配,组合出了海量配置,并依次开展计算、输出结果。MELVIN 就这么诞生了。“短短几小时内,这套程序就找出了我们这几位科学家耗费数月都没能找到的解决方案。”克雷恩指出,“那真是疯狂的一天,我至今都不敢相信这真的发生了。”

接下来,他又赋予了 MELVIN 更多的智慧。每次找到一种有用的配置,MELVIN 都会将其加入自己的“工具箱”。“这套算法会记住这些,并试着用它们来寻找更复杂的解决方法。”

但令克雷恩在维也纳那间咖啡馆里百思不得其解的,也正是“进化后”的 MELVIN。在 MELVIN 的实验“工具箱”中,克雷恩加入了两个晶体,每个都可以产生一对处于三维纠缠态的光子。克雷恩原本以为,MELVIN 会找到一种实验配置,能够将这两组光子组合在一起,最多达到 9 个维度。但“它其实找到了一种非常罕见的解法,纠缠程度远比其它量子态都要高得多”。

克雷恩最终发现,MELVIN 其实使用了一种近三十年前由数支研究团队开发的技术。1991 年,罗切斯特大学的三名研究人员设计出了其中一种实验方法。随后在 1994 年,塞林格和奥地利因斯布鲁克大学的同事们又设计出了另一种。从概念上来看,这些实验取得的结果都是相似的,不过塞林格设计的实验配置更简单、更容易理解一些。在该实验中,先由一枚晶体生成一组光子(A 和 B),这两个光子的行进路线会穿过另一枚晶体,产生光子 C 和 D。从第一枚晶体射出的光子 A 和第二枚晶体射出的光子 C 的行进路线会完全重合,都会到达同一个探测器,因此该探测器无法判断某个光子究竟是来自第一枚、还是第二枚晶体。光子 B 和光子 D 也是同理。

移相器可以改变光子的相位。如果在两枚晶体之间放置一台移相器,并不断改变移相程度,就会在探测器处造成建设性干涉或破坏性干涉。假设每枚晶体每秒可以产生 1000 对光子;在产生建设性干涉时,探测器每秒可接收 4000 对光子;而在产生破坏性干涉时,接收到的光子数则为零,因为尽管单个晶体每秒产生的光子对数为 1000,但整个系统却并未产生一个光子。

MELVIN 的解法中也包含这样的重叠路线。令克雷恩感到困惑的是,他的算法中只有两枚晶体。MELVIN 并未在实验一开始就使用这两枚晶体,而是将它们放进了一台干涉仪中(干涉仪可以将一个光子的行进路线一分为二、再合二为一)。花了一番功夫进行研究后,他意识到,MELVIN 使用的实验设置相当于用到了不止两枚晶体,这样一来便可产生更高维度的纠缠态了。

除了生成复杂的纠缠态之外,使用两枚以上晶体的实验配置还可以实现塞林格在 1994 年用两枚晶体开展的实验的“泛化”版本。克雷恩在多伦多大学的同事埃弗瑞姆・斯坦伯格对人工智能的研究结果深感震惊。“就我所知,这种泛化是人类仅凭自己之力永远也想象不出、也实现不了的。”

在其中一种泛化的实验配置中,晶体数量为四,每枚晶体都会产生一对光子,有四条通往四个探测器的重叠路径。量子干涉可以形成建设性干涉,即四台探测器都能探测到光子;或是破坏性干涉,即没有一台探测器能探测到光子。

但直至不久之前,真正开展这样的实验都一直是一个遥远的梦想。不过今年三月,中国科技大学研究人员与克雷恩在联合发表的一篇预印论文上报告称,自己在一枚光子芯片上搭建了完整的实验配置,并成功开展了这项实验。由于光子芯片的光学稳定性极强,研究人员在实验中连续收集了超过 16 个小时的数据,而这在大规模实验中是不可能实现的。

在刚开始尝试将 MELVIN 的研究成果简化和泛化时,克雷恩和同事们意识到,这种解法其实和数学中一种名叫“图”的抽象表达形式很相似。图由“顶点”和“边”构成,可以用于描述物体之间的配对关系。在量子实验中,每个光子的行进路线可以用“顶点”来表示,而每枚晶体则可以用连接两个顶点的“边”来表示。MELVIN 先是创建了这样一个图,然后开展了一系列名叫“完美匹配”的数学运算,即让每个顶点仅与一条边相连。这一过程可以使最终量子态的计算大大简化,不过对人类来说仍然难以理解。

不过,MELVIN 继任者 THESEUS 的出现改变了这一点。它可以对第一步生成的复杂图进行筛选,逐渐将边和顶点的数量减少到不能再少(如果进一步减少,该实验设置便无法产生想要的量子态)。这样的图比 MELVIN 的完美匹配图简单得多,因此更容易被人类解读。

澳大利亚格里菲斯大学的埃里克・加瓦尔坎迪对这些研究工作深感震撼。“这些机器学习技术真的很有意思。对人类科学家而言,有些解法看上去十分‘新颖’。不过就现阶段来说,这些算法离真正具备提出新想法、创造新概念还差得很远。不过,我相信这一天迟早会到来。尽管我们如今仍在婴儿学步,但千里之行,终归要始于足下。”

斯坦伯格也赞同这一观点。“就目前来说,这些已经是绝妙的工具了。就像所有优秀的工具一样,它们已经帮助我们实现了一些原本不可能实现之事。”

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注