前言
本文将会在相对论时空观下探讨分析力学的基本量——拉格朗日量的由来,在实际发展中,拉格朗日量最初只是凑出来为动能减势能,这是基于牛顿时空观的,在亚光速尺度这个定义就不适用了,于是我们就从相对时空观出发,导出拉格朗日量的形式。另外,本文均采用+---的度规,即。
正文
最小作用量原理
我们考虑一件事,一个小球从到且没有任何约束,显然有无数种走法,然而实际我们只会观察到一条路径,由于我们这里采用相对论时空观,这个轨迹就需要是洛伦兹不变的,我们可以将其采用世界线的形式,基于朴素的对称原理,我们可以认为,不同轨道之间一定有某种可以反映其特征的量,且这个量具有洛伦兹不变性,因为每个参考系所观察到的轨道都是一致的。物理学家把这个能反映轨道特征的量称作作用量,记作。由于的宗量并不是数,而是一个函数形式的轨道,因此从数学上来说,是世界线的泛函。我们记粒子的所有可能世界线为
这个被积函数就称作拉格朗日量,你可能会疑惑,为什么其不包含的更高阶导数,实际上,这是一条经验公式,我们并不清楚如何处理包含更高阶导数的理论。
它们有一些深刻的、系统性的困难。
这些困难被称为Ostrograski不稳定性,即包含高阶导数的系统的能量没有下界,以至于系统中的所有态总会自发衰变到能量更低的态上去,这类系统中找不到稳定的状态。
我们得到了作用量之后就会开始思考,真实轨迹对应的作用量有什么特点。答案是真实轨道的作用量需要取得极值。这个原理就是大名鼎鼎的最小作用量原理。我们对作用量进行变分,得到作用量取极值需要满足的条件为
详细推导见我的上一篇文章面向理论力学的变分法速通。
拉格朗日量本身并没有什么具体的物理意义,它只是我们为了区分不同的世界线所人为定义的一个量。它所确定的运动方程才是我们所关心的,拉格朗日量变了,但是由它所确定的经典运动方程没变,我们的经典物理就没变。
例如我们可以给拉格朗日量加上一个给定函数对于时间的全导数
积分后得到 变分后得 因为变分操作仅对进行,因此,又因为起点和终点的,所以后面两项的贡献为0。因此取极值时取极值,因此可以差一个给定函数对时间的全导数,但是若括号里就应写为而不一定为0,因此函数不能显含除外的变量。
时空坐标
在经典时空观中,不随伽利略变换而改变的是粒子的位矢,即,它不随伽利略变换而变化(注意,这里说的是它本身不变,并不是说它的分量不变,比如一个位矢是由Taki指向Anon,且假定这个位矢在坐标系1下为,伽利略变换至坐标系2后,该位矢的分量可能变为,但无论如何改变,它始终是由Taki指向Anon的。)。
但是回到相对性时空观,只用三个空间坐标分量是无法满足洛伦兹协变性的,因此我们需要引入时间分量,我们用
来表示,我们称其为一个逆变四矢量,角标在下我们就称其为协变四矢量,逆变和协变矢量可以通过度规来互相转化,如
这里我们已经采用了所谓的爱因斯坦求和约定(Einstein summation
convention),即对于两个相同指标默认求和。且已经求和的指标我们称其为赝指标,可以随意更换字母只要仍保持对其求和就行,比如上面的这个式子,我们可以将其写为
一个上标和一个相同下标的求和我们称其为指标的缩并。一个协变矢量与一个逆变矢量相乘并缩并掉上下标后,可以得到一个洛伦兹标量,也称为这两个矢量的内积。
自由粒子的运动方程
首先从对称性出发,我们可以断言自由粒子的作用量只会有如下形式 其中是该粒子世界线的线元,即。它是一个洛伦兹标量,前面的负号是为了兼容传统的牛顿力学,是物体的静质量,且必定为正值,这个稍候我们会给出证明,是真空中光速,这个的加入是为了让作用量的量纲与传统理论兼容。
三维形式拉格朗日量
我们首先用三维形式拉格朗日量对其求运动方程。 因此 这恰好是爱因斯坦给出的相对性粒子的动量,因此运动方程为
从这里我们也可以证明质量必须为正值,首先有
可见若则作用量的二阶泛函导数小于0,即此时作用量取得极大值,这是不符合最小作用量原理的。
四维协变
接下来我们直接对四维协变形式的作用量进行变分导出运动方程。首先,我们先找到一个粒子四维坐标的参数,这里我们取为粒子的固有时(即假设粒子自己带上一个时钟,该时钟上的读数即为粒子的固有时),记为,则有。
设,因为固有时是在粒子系中所得的所以此时有,又因为,故 分部积分得
其中边界项因为是固定起点终点的变分,故舍掉。由该式可知自由粒子运动方程即为,即匀速直线运动。
标量场中粒子
我们假定有一标量场
它是一个无量纲的场,且
,它对粒子的影响可以有各种方式,我们考虑最简单的情形,即使得线元长度发生变化,因为在
时需退化到自由粒子情形,为了方便,我们选取指数函数刻画场对粒子影响。即
接下来我们采取四维协变变分的方法导出其运动方程,至于三维拉格朗日量形式,相信读者自证不难(其实是我懒得写了(笑))。
分部积分中,我们丢掉边界项得
即运动方程为
。