史蒂芬·施拉明格 (Stephan Schlamminger) 手中的信封里藏着一个秘密,他是世界上重力实验测试的顶尖专家之一。在 2022 年 4 月美国物理学会会议上的一次演讲中,他似乎正准备打开信封,阅读一份数字,以揭示他一生所热衷的最新努力是否取得了成功。
马里兰州盖瑟斯堡国家标准与技术研究所的施拉明格试图测量牛顿的引力常数。信封中的秘密数字是一种代码,是在他的 NIST 实验中故意插入的特定错误,以掩盖测量的进展。只有一个人知道这个号码。那个人不是施拉明格。

如果无法接触到它,他就无法知道实验发现了什么。施拉明格对自己保密是为了防止实验中出现偏见,包括即使是最优秀的实验学家也可能遇到的无意识偏见。这是确保实验完整性的额外预防措施,有助于解决过去几十年来逐渐出现的常数(G)测量中神秘的差异。
G,通常被称为“大 G”(以区别于“g”,“g”取决于 G,是地球表面附近重力加速度的特例),反映了任何有质量的物体之间的重力强度。它决定了行星和星系的轨道,并描述了将你拉向地面的力。英国伯明翰大学的物理学家克莱夫·斯皮克(Clive Speake)表示,没有人知道如何从理论上预测 G 的实际值,他开发了施拉明格在 NIST 所使用的仪器。
测量起来也非常困难。经过两个世纪的精确度提高后,最近的 G 测量结果令人不安。世界各地的一些实验室已经得出了不同的值(SN 在线:2015 年 4 月 30 日 )。分散的值可能表明不同群体之间的测量技术存在问题,或者可能存在更有趣的方面。
“房间里有一头令人难以忘怀的大象,这表明也许正在发生一些我们不明白的事情,”斯皮克说。“如果测量正确,那么这可能是自牛顿以来最伟大的发现。”
与 COVID-19 时代的许多科学演讲一样,施拉明格的揭晓也以虚拟形式进行。想必世界各地的其他物理学家和科学记者都像我一样,弯腰伏在屏幕上,等待着这个秘密数字告诉我们关于 G 的什么信息。
是时候撕开信封了。但视频停止了。大型揭晓活动已被取消。测量结果中令人费解的差异意味着这些数字不可信。当施拉明格返回实验室再次尝试物理学中最具挑战性的测量之一时,信封将密封至少一年。
牛顿万有引力常数是多少?
牛顿引力常数是一个误称。尽管艾萨克·牛顿在 17 世纪发展了他的引力理论,但他并没有用 G 来思考。他主要感兴趣的是力如何移动物体。苹果坠落、行星在轨道上运行以及地球令人惊讶地被压扁的形状只是牛顿理论解释的无数现象中的一小部分,所有这些都没有明确提及 G。两个世纪后以牛顿命名的常数被包裹在所涉及的质量中。
我们现在知道,牛顿的理论只是爱因斯坦更广泛的引力理论(即广义相对论)的近似。爱因斯坦的理论解释了黑洞的强大引力以及时空的扭曲。尽管如此,在地球上,施拉明格和其他想要测量 G 的人关心的是牛顿的引力理论。
重力取决于三个因素:所涉及的质量、质量和 G 之间的距离。例如,质量和距离的不同取决于您是否考虑的是您与地球之间的力,或者是绕地球运行的行星之间的力。太阳,G 总是一样的。与基本粒子的质量、电子电荷和光速一样,G 是当今科学至关重要的数十个常数之一(SN:2016 年 11 月 12 日,第 14 页 24)。
然而,G 却脱颖而出。它是有记录的最古老的常数之一——之前只有光速被测量过。然而,尽管自 225 年前英国物理学家亨利·卡文迪什 (Henry Cavendish) 首次测量 G 以来进行了数百次优雅的实验,但 G 仍然是最不精确的基本常数之一。
在某种程度上,近几十年来,随着新的、不兼容的测量方法的出现,我们对 G 的理解只会变得更糟。
最近对大 G 的测量结果不一致
当卡文迪什在实验室中首次测量重力时,他依靠的是一组铅球。其中两个悬挂在一根 6 英尺(约 2 米)长的杆的两端,整个装置悬挂在一根电线上。然后,他在附近放置了较大的铅球,并通过跟踪悬挂杆在电线上的扭曲情况来测量球体之间的力。尽管卡文迪什主要对计算地球的密度感兴趣,但对他的结果进行一些处理表明他第一次有效地测量了重力。他得到的价值比今天普遍接受的价值高出约 1%。
许多现代 G 实验都是卡文迪什装置的改进版本。其中包括施拉明格使用的那个。施拉明格的系统没有使用铅球,而是使用精确加工的铜圆柱体。四个 1.2 公斤的圆柱体(称为测试质量)放置在一个悬挂在金属带上的圆盘上。悬挂的圆柱体和附近四个较大的、大约 11 公斤重的铜圆柱体之间的引力导致圆盘在带上旋转。施拉明格将重型气缸称为质量源。他还用一组由蓝宝石晶体制成的源质量进行了实验,看看 G 是否取决于所涉及的材料(它不应该)。卡文迪什使用一个大木箱来保护他的设备免受杂散微风的影响,而施拉明格则依靠真空室来几乎完全消除空气。
从概念上讲,NIST 进行的实验与卡文迪什使用的实验相同。但现代实验提供了更高的精度。
卡文迪什的实验返回的值为 6.74 x 10-11 立方米每千克秒平方。该数字的正确率约为百分之一。如今,可接受的值为 6.67430 x 10-11 不确定度约为 50,000 分之一,这意味着误差为正负 0.00002 x 10-11。一些实验通过依靠在重物附近摆动的钟摆而不是扭转电线,达到了类似的精度。
但随着精度的提高,新的问题也出现了。过去 20 年,不同团体的测量结果并不一致。就好像 G 在不同的地方和不同的时间略有不同,这是实验误差无法解释的。施拉明格的仪器是从位于法国塞夫尔的国际计量局 (BIPM) 借给 NIST 的,研究人员得出的值为 6.67554 x 10-11,明显偏离可接受的值(SN 在线:2013 年 9 月 12 日 )。
造成差异的最可能原因是每个实验系统都有其独特之处。研究人员热衷于追踪此类系统错误。但测量重力很困难,既因为它是最弱的基本力(重力太弱,以至于一些现代实验使用大量材料来追踪重力),也因为任何有质量的东西都具有重力。没有办法使实验免受其他重力来源的影响,因此研究人员必须尝试考虑外部影响。
或者,G 的差异可能与实验进行的地点有关。例如,塞夫尔的 G 值可能确实比最近在科罗拉多州博尔德测量的 G 值高 0.04%。为本文联系的专家中没有一个人认为这种情况是可能发生的。但通过借用 BIPM 重力实验并将其转移到马里兰州 NIST 园区,施拉明格的努力应该有助于确认 G 不会因地点而异。这是假设他能够解决 2022 年 4 月的发布会中出现的问题。
为什么我们关心大 G 的精度?
为什么科学家需要以更高的精度测量 G?
一些专家认为,事实并非如此。“从实践的角度来看,更好地了解 G 并不会带来巨大的好处,”盖恩斯维尔佛罗里达大学的物理学家克利福德·威尔 (Clifford Will) 说。其他常数,如电子电荷和光速,“在各种重要技术中发挥着巨大作用,而 G 则不然,因为引力太弱了,”威尔说。“到了引力变得重要的时候,从行星到宇宙的尺度上,重要的是 G 乘以质量。”
伦敦帝国理工学院的物理学家克劳迪娅·德·拉姆有不同的看法。“G 控制着引力的强度。在牛顿引力中,它告诉我们两个大质量物体如何通过引力相互吸引,但在爱因斯坦的广义相对论中,这个常数传达了我们宇宙中的任何事物如何弯曲时空结构。”她说,更好地掌握 G 可能有助于解释为什么引力比电磁力或将原子部分结合在一起的强核力弱得多。
尽管广义相对论已被证明是历史上最成功和革命性的理论之一,但德拉姆指出,它对引力的描述可能并不完整(SN:2/13/21,第 14 页 16)。“以更高的精度测试 G 可以让我们了解 G 到底有多恒定和普遍,以及除了爱因斯坦的广义相对论之外是否存在其他东西,”德拉姆说。
一些研究人员推测,对 G 的精确测量有一天可能有助于揭开科学中最深奥的谜团之一的答案:为什么引力与量子物理学不相符?粒子物理学的标准模型是一种量子理论,它描述了宇宙中除引力之外的几乎所有事物。德拉姆说,更好地理解 G 可能会导致引力的量子版本,这对于将引力融入标准模型是必要的。至少自爱因斯坦以来,这样的“万物理论”一直是物理学家的梦想。
对于施拉明格来说,动机是多方面的。“这主要是纯粹的好奇心。现在,伤口上撒了盐,[实验组之间] 的一致性非常糟糕。”将一项极其困难的实验推进得更远的兴奋感也驱使着他。“人们为什么要攀登珠穆朗玛峰?”施拉明格说。“因为它就在那里。”
测量大 G 的其他方法
卡文迪什式实验的一个长期挑战是电线。为了解释 G 发生了什么,研究人员必须知道悬线如何响应扭曲或摇摆,以及它们如何随着老化而变化。
一些研究人员选择完全去掉讨厌的电线,而是扔下或扔东西,看看它们对附近质量的拉力有何反应。迄今为止,这些实验最精确的版本是将过冷的原子云抛入塔中,然后让它们再次落下。通过抛掷附近各种结构的重物体,研究人员可以看到这些物体施加的引力如何影响原子的轨迹。到目前为止,这些实验与最精确的悬浮质量实验相比还差十倍左右,达到了五千分之一的精度。
最近一项出于其他目的而设计的实验也省去了电线。激光干涉仪空间天线(LISA)探路者任务是对不同类型重力实验的原理验证测试。它的目的是表明精确测量太空中物体之间的距离是可能的——这是构建天基引力波探测器的关键(SN 在线 12/3/15)。
LISA Pathfinder 能够很好地测量物体之间的距离,找到 G 的精度约为十五分之一。与卡文迪什的百分之一的精度相比,这很粗糙,而且比其他现代测量方法差得多。但它表明,太空实验没有复杂的电线和附近的大质量物体(如地球),有可能以一种全新的方式测量重力。

类似卡文迪什实验的另一个缺点是,它们测量的是缓慢移动或完全静止的物体之间的力。这些实验并不能说明当物体快速移动时 G 是否保持恒定。
在瑞士山深处的实验中,苏黎世联邦理工学院的机械工程研究员 Jürg Dual 正在用像直升机桨叶一样旋转的振动梁或杆取代静态质量(SN 在线:7/11/22)。这些运动导致移动部件和充当检测器的光束之间的距离发生变化,这反过来又改变了检测器光束感受到的重力。探测器光束像音叉一样振动,这些振动的大小提供了 G 的测量值。
与传统的实验不同,这个实验可以检测 G 是否依赖于运动,这“实际上可能是一件非常壮观的事情,”Dual 说。至于这种可能性有多大,“我完全持开放态度,”他说。
不过,就目前而言,施拉明格和其他人使用悬挂质量(就像 225 年前卡文迪什所做的那样)仍然提供了最精确的测量。
目前还没有明确的答案
施拉明格位于 NIST 园区的实验室远低于他的办公室。“大约有四层楼的地下,”他说。“振动更少,更容易稳定温度,而且实验室地板不会倾斜太多。通常建筑物会随着不同的风荷载而倾斜。这在地下不是问题。”
在取消揭晓一个月后,我访问 NIST 时,我们走下几段楼梯,在一个空荡荡的大厅里散步,然后进入一个里面有一张粘垫子的房间。当你进去时,它可以清除鞋子上的灰尘。即便如此,施拉明格还是换上了他藏在实验室里的一双专用鞋子,并给了我一个套子,让我套在鞋底上。然后我们穿过另一扇气密门,参观借给 NIST 的重力实验。当您尝试做像测量 G 这样困难的事情时,事情必须整洁。
灰尘干扰测量探头的尖端可能会影响气缸位置的读数。“第二个担忧虽然较小,”施拉明格说,“是落在源质量上的尘埃会改变它们的质量。”
G 实验比卡文迪什的开创性设计要小。您可以将它放在朴素的餐桌上。在这里,它坐落在一块巨大的平板上,可以最大限度地减少进入实验室时的振动。真空室隐藏了设备的一些移动部件。
Schlamminger 目前正在运行之间,但四个铜源质量(每个质量约为 2 升汽水瓶的直径)已准备好进行下一次 G 测量。源质量放置在真空室外部的转盘上,而测试质量则放置在悬挂在真空室内的圆盘上。

在最接近卡文迪什实验的实验模式中,跟踪圆盘在悬挂带上扭转时的旋转,可以测量源质量和测试质量之间的力,从而揭示 G。在另一种模式中,施拉明格通过查找阻止磁盘旋转所需的力。
附近的一个盒子里有一组与铜源质量相同的蓝宝石晶体源质量。它们可以取代转盘上的铜,以确认 G 是一个真正的常数,不依赖于所涉及的材料。铜质圆柱体的质量大约是蓝宝石圆柱体的两倍,可以更好地测量 G。不过,施拉明格并不知道每个源质量的精确重量。这是因为密封信封里藏着秘密号码。
“大 M,也就是我的大铜质量的质量,”他说,“我基本上已经要求 NIST 的这个质量小组测量了它们,添加了一个随机因子。”由于真实质量中添加了随机因素,他对 G 所做的任何研究都会略有偏差。直到他打开信封才知道测量值到底有多差。那么他为什么不在 2022 年 4 月开放呢?
“我测量了大 G 大约三个月,”施拉明格说道,然后打开真空室检查气缸的位置。“然后我又进行了一次大 G 跑,次数不同了。这就是为什么我没有打开信封,因为我觉得有些东西我不明白。”
原来他已经预先录制了自己的演讲,并期望在会议上实时揭晓答案。他在演示开始前改变了主意,这就是观众感到疑惑的原因。
有迹象表明,随着打开和关闭实验室而产生的真空质量的变化与测量偏移有关。施拉明格表示,如果研究人员想要了解牛顿引力常数测量结果的差异,他们就必须牢记这一点。
如今,施拉明格又进行了另一次实验。但一年后,在明尼阿波利斯举行的 2023 年美国物理学会会议上,他仍然没有准备好打开信封。“我对此非常非常小心,因为你无法打开信封。”
