上QQ阅读APP看书，第一时间看更新

第1章狭义相对论

为了理解黑洞，我们需要学习一些相对论知识。相对论分为两个部分：狭义相对论和广义相对论。爱因斯坦于1905年提出了狭义相对论，主要是关于物体相对于其他物体的运动，他还提出，观测者的运动状态会影响到观测者的空间和时间体验。狭义相对论的核心思想可以用一种被称为“闵可夫斯基时空”（Minkowski spacetime）的优美的几何形式来表述。

广义相对论在狭义相对论的基础上加上了引力理论，它是我们真正理解黑洞所需要的理论。爱因斯坦花了10余年的时间来构建广义相对论，直至在1915年年末发表的一篇论文中，他才提出了最终的爱因斯坦场方程。这些方程描述了引力是如何将闵可夫斯基时空扭曲成弯曲时空的，比如在第3章中我们将会介绍的施瓦西黑洞时空。相较于广义相对论，狭义相对论更简单，这是因为狭义相对论没有考虑引力，也就是说，引力效应被忽略了，或引力太微弱，不会造成显著的影响。

狭义相对论提到了公式E=mc²，它将能量E、质量m以及光速c联系在一起。或许在所有人心目中，它是物理学中最著名的方程之一。这个公式使我们能够预见核武器令人震慑的强大威力，还寄托着我们开发核聚变清洁能源的希望，虽然目前还没有实现。E=mc²也与黑洞物理学紧密相关。在我们第一次观测到的黑洞合并事件中，有相当于三个太阳质量的能量被释放出来，这就是关于质量和能量守恒关系的最好例证。要想对这种碰撞的灾难性有个直观的概念，你可以想象一下，在核武器（假设当量为400千吨）爆炸中转化为能量的质量只有19克。

狭义相对论与詹姆斯·克拉克·麦克斯韦（James Clerk Maxwell）的电磁理论密切相关。事实上，早在19世纪后期，有关相对论时空观的早期暗示就以所谓的“洛伦兹变换”（Lorentz transformations）的形式出现了。洛伦兹变换解释了观测者感知的电磁现象是如何随观测者的运动而改变的。光是一种最常见的电磁现象，它是电场和磁场的“行波”（traveling wave）。麦克斯韦理论的结论之一是，光具有确定的速度。相对论就是建立在光速是一个常数的基础之上，与观测者的运动无关。

狭义相对论用参照系来描述观测者的运动。要想知道什么是参照系，可以想象一列满载着乘客和行李的高速运动的火车。火车上的一切相对于火车都是静止的，但是火车相对于地球运动得很快。假设火车正沿着一条直线以恒定的速度运动。为了完整准确地给出参照系的解释，我们应该设定不存在任何显著的引力场。比如，我们不再考虑在地球表面匀速行驶的火车，而是想象在真空中以恒定的速度飞行的宇宙飞船。在这种情况下，地球的引力场足够弱，以至于我们可以忽略它对火车的影响，从而只用狭义相对论即可，而不需要引入广义相对论。

如果不往窗外看，我们很难知道火车开得有多快。特别是在火车运行非常平稳，轨道非常平坦，百叶窗也都合上的情况下，我们不可能知道火车正在移动。火车提供了一个参照系，乘客可以自然地运用它来判断火车内部的东西是否在移动。他们无法判断（在上文描述的理想情况下）整列火车是否在移动，但他们肯定知道有人走过过道，因为这个人正相对于他们的参照系在移动。此外，无论火车是否真的在动，所有物理现象，比如掉落的球或旋转的陀螺，在火车上的观测者看来都表现得与火车静止时一样。简言之，参照系是一种观察空间和时间的方式，它与一个或一组处于匀速运动状态的观测者相关。匀速运动意味着火车不会加速、减速或转向，因为如果火车正在加速运动，乘客将会感到他们被推回座位上；如果火车正在减速运动，乘客将会感到自己被甩向前方。

现在，我们想象火车在经过一个车站时既没有加速也没有减速的情况。火车上的三位乘客艾丽丝、阿伦和艾弗里，是正在运动的A参照系中的观测者。与此同时，他们的朋友鲍勃、贝特西和比尔正站在站台上，我们把这样的一个静止参照系称为B参照系。为了画出这些参照系，我们把B参照系的位置作为水平轴，把B参照系的时间作为垂直轴，并标示出不同的观测者在时空中的轨迹。随着时间的推移，B参照系的观测者总是待在固定的位置上，而A参照系中的观测者向前移动了（图1–1）。这个示意图实际上就是闵可夫斯基时空，时空一词意指我们将时间与空间展现在同一幅图中。我们也可以从一个不同的视角去看闵可夫斯基时空，即A参照系中的观测者相对静止而B参照系中的观测者向后移动。我们稍后再谈这个视角。

狭义相对论成立的前提是光速恒定，也就是说，火车上的观测者和站台上的观测者测量的光速是一致的。否则，观测者就可以通过测量光速来判断自己到底处于哪一个参照系。但是，相对论的一个核心原则是：在任何参照系中，物理效应都应该是一样的。这样一来，你就不能从任何物理测量中分辨出你处于哪个参照系。根据这个原则，我们不能说“在这个参照系内的物体是静止的，在其他参照系中的物体则是运动的”，而只能说“任何参照系都是一样的。我们唯一能认同的关于运动的观点，就是一个观测者相对于另一个观测者的运动”。换句话说，运动状态不是绝对的，而是相对的。因此，“A参照系在运动，而B参照系为静止的”的说法不恰当。我们只能说，它们处于相对运动状态（尽管B参照系静止的观点看上去很自然，因为我们总是考虑相对于地球的运动）。

图1-1 闵可夫斯基时空和参照系。在左图的闵可夫斯基时空里，三个观测者在B参照系中是静止的，另外三个观测者在A参照系中是向前运动的。在右图的闵可夫斯基时空里，B参照系中的三个观测者是向后运动的，而A参照系中的三个观测者是静止的

我们关于相对运动的解释似乎符合常识，接下来我们应该问自己，如何从中得到关于时间和空间的本质问题的线索。问题的关键在于麦克斯韦的电磁理论。这个理论告诉我们（当然不止这些），如果火车上的艾丽丝掏出一支激光笔，朝着火车的运行方向发射一个光脉冲，与此同时，站台上的鲍勃也朝同一方向发射一个光脉冲，那么这两个光脉冲将以相同的速度向前传播。这似乎也是一个无伤大雅的说法，但事实并没有这么简单！如果我们让火车以99%的光速行驶（这显然不是美国的火车），那么鲍勃岂不是会测量到艾丽丝发射的光脉冲速度几乎是光速的两倍？毕竟，艾丽丝相对于鲍勃以99%的光速向前运动，她发射的光脉冲又相对于她以光速向前传播，因此鲍勃似乎会测量到她发射的光脉冲以199%的光速前进。但根据电磁理论，这又是不可能的！事实上，鲍勃会测量到光脉冲相对于他的运动速度，与艾丽丝测量到的光脉冲相对于她的速度相等，正好都是光速。

这怎么可能呢？原因在于，艾丽丝和鲍勃测量时间流逝的方式不同，他们测量长度的方式也不一样。其中的细节就隐藏在洛伦兹变换的数学表达式中，洛伦兹变换能将A参照系中的时间和长度转换成B参照系中的时间和长度。闵可夫斯基时空中的洛伦兹变换可以很容易地用图来表示。洛伦兹变换前（图1–1的左图），我们可将B参照系视为静止的，将A参照系视为运动的。而在洛伦兹变换后（图1–1的右图），A参照系是静止的，而B参照系是向后运动的！洛伦兹变换仅仅是观察视角的变化，一个是鲍勃将他的参照系看作静止的视角，另一个是艾丽丝将她的参照系看作静止的视角。

洛伦兹变换的主要结论包括时间延缓和长度收缩。我们先解释时间延缓，因为它更容易描述。假设一个星期五的中午，你要从美国新泽西州的普林斯顿站上火车。为方便起见，我们将这个时间和地点对应于闵可夫斯基时空的原点，即t轴和x轴的交叉点。现在经过普林斯顿站的有快车和慢车，快车向北去往纽约，慢车向南去往费城，你可以自行决定搭乘哪一列。你要做的事情就是，看表计时，坐恰好一个小时的火车，然后下车标记出你所在的位置。很明显，如果乘坐的是快车，你将会走得更远。要知道，当你乘坐的火车速度是原来的两倍时，你走过的路程也将是原来的两倍。事情的微妙之处就在于，搭乘火车的一个小时是你用自己的表来度量的，而火车的速度是由相对于地面静止的观测者测量的，他们的表记录下的时间会与你的表有差异，因为他们与你处在不同的参照系中。

那么，你一个小时后会抵达哪里？或者说，如果你和你的一群朋友分别乘坐不同的火车（同时离开普林斯顿站），你们一个小时后将到达何处？答案是，你们都会处于闵可夫斯基时空中的双曲线上（见图1–2）。换句话说，双曲线是一个小时之后所有可能抵达的位置的集合。其中一个可能的位置是下午1点的普林斯顿站，如果你在一辆静止的火车上坐一个小时，你就会“到达”时空中的这个点。在这样的情况下，你到达这个点的时间自然是下午1点，因为你的参照系与普林斯顿站的参照系相同，所以你的表和车站的时间也一致。但如果你上了一列去往其他地方的火车，你的表就会比车站的时间走得慢，所以当你结束了一个小时的旅途时，实际上到达车站的时间会比你以为的要晚，这种效应就是时间延缓，在闵可夫斯基时空中以双曲线的形式表示。当你离出发地点越来越远时，双曲线也会越来越向时间轴的上方弯曲。在从普林斯顿到纽约的旅途中，到站时间大约只比你认为的时间晚1/1011秒。因此，时间延缓并不会让你上班迟到。所以，闵可夫斯基时空有时也被称为双曲几何。

图1-2 从普林斯顿站出发的列车，在一个小时后可到达的所有点构成的曲线是双曲线

在闵可夫斯基时空中，我们用与时间轴的夹角正好为45度的斜线来表示光的恒定速度。你会发现，由一个小时旅程的所有可能的终点构成的双曲线，完全位于从原点发出的两束光线围成的时空区域内。可见，在闵可夫斯基时空中，没有火车能比光跑得快。

看起来我们对时间延缓的讨论好像与洛伦兹变换没有多大关联。为了展示它们之间的关联，我们将火车的参照系设为A，将地球的参照系设为B。假如艾丽丝每天在A参照系中花一个小时从普林斯顿站去往纽约，与此同时，鲍勃和他的朋友们仍然相对地面静止，他们该如何知晓艾丽丝到达的时间？打电话不太有效，因为艾丽丝的电话信号只能以光速传播，鲍勃和他的朋友们必须根据他们接到她的电话的时间、信号的速度和与纽约的距离来计算艾丽丝的到达时间，怎么看这都太复杂了。所以，鲍勃想出了一个更好的办法，他和他的一个朋友（比如比尔）同步了他们的手表时间。鲍勃和比尔分别在普林斯顿火车站和纽约火车站工作，鲍勃负责测量艾丽丝离开的时间，比尔负责测量艾丽丝到达的时间。这样一来，就不需要打电话了。在遥远的观测者之间精确地同步手表时间似乎有些不易，但有一个很好的办法是，在艾丽丝登上火车之前，鲍勃和比尔都来到普林斯顿火车站和纽约火车站的中点位置，同步他们的手表时间，然后两人再以相同的速度回到各自的火车站。

在以上关于艾丽丝旅途的叙述中，A参照系显然是特殊的，因为艾丽丝不需要任何朋友的帮助，就可以测量她的整个旅程的时间，而鲍勃和比尔必须合作才能完成这项工作。艾丽丝测量的时间间隔，被称为“固有时”（Proper time），因为艾丽丝在她的参照系（A参照系）中一直处于固定位置。而鲍勃和比尔测量的时间间隔（B参照系）总是大于固有时。时间延缓是A参照系与B参照系关于时空视角的关联性的部分体现，因为A参照系和B参照系间的洛伦兹变换就包含了时间延缓和其他一些效应。

类似的讨论还可以用来描述长度收缩。让我们想象一下，鲍勃、比尔和艾丽丝不再坐火车了，而是去参加奥运会。艾丽丝希望自己能在撑竿跳比赛中创造新的纪录。她的制胜秘诀是跑得非常快，速度可达光速的87%。（出于某种原因，她还是把100米短跑比赛的冠军头衔让给了博尔特，即使她认为自己可以以少于0.4微秒的时间创造该比赛项目的世界纪录。）艾丽丝选择了一根6米长的竿子，虽然这比大多数撑竿跳运动员用的竿都长，但她毕竟是非常特殊的选手。鲍勃和比尔不相信艾丽丝的竿子真有那么长，所以他们打算在艾丽丝水平地拿着她的竿子沿跑道快速奔跑的过程中进行测量。显然，这是一项很困难的任务。怎样才能完成测量呢？他们想出了一个办法。他们先同步了手表时间，然后站在相距不到6米的地方。两人约定好在某一时刻看一眼艾丽丝，并记录下各自看到了竿的哪一部分。经过多次尝试，他们设法让鲍勃看到的是竿子的后端，而比尔看到的是竿子的前端。然后测量两人之间的距离，结果显示他们相距3米，因此他们断定艾丽丝的竿子只有3米长。他们向艾丽丝说明了他们的发现，但艾丽丝反驳说他们肯定弄错了。艾丽丝向她的两个朋友阿伦和艾弗里寻求帮助，他们两人都跟着她跑（显然他们也是优秀的短跑运动员），并在她的参照系中测量她的竿子长度。结果阿伦和艾弗里发现艾丽丝的竿子确实有6米长。

A参照系在这次讨论中再一次显示了其特殊性，因为它是唯一与艾丽丝的竿子保持静止的参照系。在A参照系中测得的长度被称为“固有长度”（proper length），而在B参照系中测得的长度往往会变短，这种效应被称为长度收缩。时间延缓和长度收缩密切相关，我们可以继续想象，艾丽丝离开运动场前往酒吧。在她的世界里，去酒吧需要花半个小时，同时鲍勃和比尔会用我们之前提到的，测量艾丽丝乘火车去纽约所需时间的方法进行测时。这个时候时间延缓涉及一个因子2，即艾丽丝的冲刺速度达到了破纪录的87%的光速。长度收缩也涉及一个因子2，即A参照系中的观测者说她的竿子有6米长，而B参照系中的观测者说她的竿子只有3米长。总的来说，时间膨胀和长度收缩总是涉及相同的因子，有时我们称这个因子为洛伦兹因子。

到目前为止，我们关于狭义相对论的时空几何的讨论，似乎与著名公式E=mc²没有什么关系。现在，我们通过考虑E=mc²的部分推导过程，来尝试建立这一联系，其中最重要的步骤可以用几何语言来描述。之所以只进行部分推导，是因为它会涉及一些未经这本书中充分论证或推导的公式。

第一步，我们用一个公式来说明质量到底是什么。此处最适用的公式是p=mv，其中p是动量，v是一个质量为m的物体缓慢运动的速度。p=mv的关系可以从牛顿力学中直接得到，当v远小于光速时，该公式是没有问题的。第二步，与能量建立联系。在这里，我们要不假思索地使用另一个电磁学公式：光脉冲的动量p与它的能量E之间的关系为p=E/c。我们已经知道，光是特殊的物质，因为它在任何参照系中都以恒定的速度运动，这和有质量物体的行为方式很不一样。在给定的参照系中，有质量物体可以静止不动，也可以以一定的速度v运动，但由狭义相对论可知，这个速度必须始终小于光速。

现在，我们知道了一个有质量物体的动量（p=mv）和一个光脉冲的动量（p=E/c）。我们不能简单地让这两个动量相等，因为有质量物体与光脉冲是不同的！我们需要做的是，寻找一个通过光脉冲构建有质量物体的动量方程的方法，然后用动量方程推导出E=mc²。

以下是我们的主要思路。我们安放两面可以完美反射的镜子，让它们彼此面对面，并让两束完全相同的光脉冲以彼此相反的方向在镜子之间来回传播。我们认为，这个装置等效于一个有质量物体。假设镜子非常轻，以至于我们可以忽略镜子的质量和能量。这样一来，整个装置的能量就是单束光脉冲能量的两倍。该装置的动量恰好为零，因为一束光脉冲有向上的动量，另一束有向下的动量，它们相互抵消了。所以，系统整体并没有向上或向下的动量，只是其中的一部分在运动。

图1-3 镜子与光脉冲装置。左图是两束相同的光脉冲以彼此相反的方向在两面镜子之间传播。右图是镜子以速度v向右移动。光脉冲从一面镜子移动到另一面镜子需要的时间是∆t，光脉冲传播的纵向距离大约是c∆t，横向距离是v∆t

为了推导出E=mc²，我们需要让这个奇妙的装置整体动起来。我们将通过跟踪其中一个光脉冲来简化这个问题，因为如果我们同时跟踪两个光脉冲，就会得到双倍的能量和双倍的质量。同时，只跟踪一个光脉冲也能简化我们关于装置相对于光脉冲是向上还是向下运动的讨论。一旦装置开始运动，光脉冲就不再只是上下传播，它还会有向左或向右运动。这就需要用到几何学知识了，光脉冲的横向运动速度是v，纵向运动速度是c（实际上，它上下运动速度会略小于c，因为光脉冲的总速度要求是c。但在我们需要的精度下，可以忽略这个细节）。另一种表达方式是，光脉冲有v/c的运动属于横向运动。所以我们有理由认为，横向动量p_横向就是v/c乘以它的总动量p=E/c，即p_横向=Ev/c²。我们现在认为p_横向=mv是合理的，因为p_横向是总装置动量的横向分量。如果将两种p_横向的形式结合起来，就会得到方程Ev/c²=mv，简化后即可得到E=mc²！

可能有人会反对说，这个用光和镜子组成的装置，和我们日常生活中的物体可不一样。这种说法并不完全正确。质子和中子构成了绝大多数日常材料的质量，可以近似地认为它们是很小的时空区域，三个几乎无质量的夸克以接近光的速度在其中四处反弹。如果这是事实，质子的质量将完全来自其组成成分夸克的运动，就像光和镜子的整体质量来自光脉冲一样。事实上，一切没有这么简单：夸克之间有强烈的相互作用，这些相互作用为质子的总能量和总质量做出了显著的贡献。尽管如此，大多数日常物质的质量来源还是与我们的光镜分析更相关，而与物质基本成分的固有质量关系不大。

我们越深入地研究狭义相对论，就越会发现麦克斯韦的电磁理论是它的重要前导，不仅如此，麦克斯韦电磁学在许多方面也是广义相对论的前导。现在让我们简述一下麦克斯韦的令人惊叹的电磁理论，作为本章的结尾。

在电磁学得到适当的发展之前，人们所理解的正、负电荷之间的吸引力，就如同牛顿理解的地球和太阳之间的引力一样。简言之，他们都没有真正理解其中的原理。牛顿自知这一点，他曾表达了希望理解万有引力起源的诉求：“我还没有从实验中发现产生重力这些特性的原因，但我预想不需要任何假设。”（引自牛顿的拉丁文原著。）当然，牛顿建立了一个非常强大的定量描述引力强度的定律，他也知道引力与引力体之间的距离平方成反比。正、负电荷之间的吸引力也遵循类似的平方反比律。但让他和他的众多后继者困扰的是，为何力可以跨越距离产生作用。换句话说，令他们感到奇怪的是，一个物体受到的作用力竟然是由另一个遥远物体的存在产生的。迈克尔·法拉第（Michael Faraday）解决了这个难题。根据他的想法，一个带电物体会产生电场并对电场产生感应，电场分布在空间中，符合麦克斯韦建立的4个方程。

图1-4 电场与磁场。左图展示了负电荷周围的电场E都指向该负电荷。右图展示了一个载着电流I的导线会产生一个环绕它的磁场B

在法拉第的理论中，负电荷并不会直接吸引正电荷。负电荷会在其周围产生指向自身的电场，电场又会吸引距负电荷有一定距离的一个正电荷，最终使正电荷被拉向负电荷。同样地，我们可以说，正电荷周围的电场都指向背离它的方向，这种电场将负电荷拉向正电荷。这两种效应同时发生。如果观察对象只是电荷，我们将得出（正确的）结论：它们感受到大小相等而方向相反的力，把它们拉到了一起。而法拉第的观点是，这些力只有借助电场的作用才会产生，与产生电场的电荷无关。

对于磁力和磁场也可以得出类似的结论。在不讨论细节的情况下，运动的电荷形成磁场并对磁场产生感应，磁场的分布由麦克斯韦方程组表示。一个非常重要的例子是载有电流的导线周围形成的磁场。电流其实就是导线内部微观尺度的电荷的运动，这也符合移动电荷产生磁场的一般规律。

与电场一样，磁场也与产生它们的运动电荷无关。为了理解这句话的意思，我们可以考虑一下麦克斯韦使用过的装置，他正是利用这套装置得出了电磁场方程组的最终形式。让两块金属板彼此平行且互不接触，并在每块金属板上连接一根导线，这种装置被称为电容器。电流会从一块板流入，而从另一块板流出。这种流动使得一块板上的正电荷越来越多（实际上，是这块板上的电子越来越少），另一块板上的负电荷越来越多（电子越来越多）。由于两块金属板间电荷的不平衡性不断增加，便产生了电场。电场从带正电的极板指向带负电的极板，随着极板电荷的增多，电场的强度也随之增大。

我们知道在载有电流的导线周围会形成磁场，因此在向电容器输送电流的导线周围也会形成磁场。但两块金属板之间没有电流，有人可能会由此天真地认为这两块板之间没有磁场。然而，麦克斯韦发现这与他对电容器的理解不符，于是他提出了一个惊人的解决方案：一个不断增强的电场，能以和电流相同的方式产生一个环绕它的磁场。这个想法是相当重要的一步，它超越了我们最初关于电荷产生电场的概念，因为现在我们看到场也能产生场。

事实上，法拉第早就知道，一个不断增强的磁场会产生一个环绕它的电场，这基本上就是发电机的工作原理。在麦克斯韦的4个方程中，有两个描述了电场和磁场之间这种相辅相成的关系；另外两个方程更简单，它们表明了磁场没有源或汇，而电场唯一的源或汇是正电荷和负电荷。所有的麦克斯韦方程都是微分方程，这意味着它们描述了电场和磁场随时间或空间的变化。这些微分方程取决于在极小的时空邻域内场的行为方式。麦克斯韦方程组中没有超距作用，所有东西都是因周围场的相互作用而形成的。

麦克斯韦最大的成功在于，他的方程暗示了光的存在。正如麦克斯韦理解的那样，光是波动的电场和磁场的组合，电场的空间变化会引发磁场的时间变化，反之亦然。麦克斯韦方程组中的物理常数描述的是电磁相互作用的强度，但当它们以正确的方式结合在一起时，便会给出光速的数值，这可以通过实验来验证。

在接下来的章节里，我们将了解到电磁学和广义相对论之间的两个关键联系：它们都涉及法拉第的场概念，都用微分方程来解释场的行为，并暗示了某种形式的辐射。在电磁辐射中，电场产生磁场，反之亦然，以自持级联的方式穿过麦克斯韦方程组所描述的时空。这种级联过程具有一个特征波长，电场和磁场的强度会从零增至一个最大值然后减至零，再从零增至另一个最大值然后减至零。可见光是波长约为半微米的光，随着波长越来越长，光就成了红外光、微波和射电；而波长越来越短的光则是紫外线、X射线或伽马射线。

图1-5 光是变化的电场和磁场在空间中的传播，它们都以光速c朝着同一方向运动。以这本书的开本大小来说，波长λ为几厘米，属于微波，它比家用微波炉的波长要短一点儿

爱因斯坦发现引力作用有和电磁作用类似的规律，这正是广义相对论的主要内容。爱因斯坦方程中的引力场比电场和磁场更奇怪：它们就是时空本身的弯曲。另一个出人意料的地方在于，广义相对论可以用纯粹几何学来描述大质量物体。这一点与电磁学非常不同，电荷在整个电磁学中始终是基本元素。这些可由纯粹几何学描述的大质量物体，就是黑洞。

第1章 狭义相对论

第1章狭义相对论