最小作用量原理



    費馬(Pierre de Fermat1601-1665)1662年提出的費馬原理(Fermat’s principle),將幾何光學中的幾個現象:光在同一介質中會直線前進、反射定律、司乃耳定律(Snell’s Law,就是折射定律),用「光會走耗時最短路徑」一句話就統合起來。我們能不能也將原本的牛頓力學視為最小化某個量值的結果呢?

 

最小作用量原理(Principle of Least Action)

    首先根據牛頓第一運動定律,自由質點會進行等速直線運動。我們都知道直線就是兩點之間的最短距離,所以可以先很自然地寫下應該要最小化類似Ni=1|Δri|的東西,其中Δri:=r(iNT)r(i1NT)T是總時長。但很明顯這樣只保證直線,還少了等速這個結果。不過仔細觀察一下就會發現改成最小化Ni=1|Δri|2就能同時得到直線運動和等速兩個結果。當然,我們需要N才會得出結果,所以實際上是討論最小化lim

    當然,求黎曼和不一定要用等距的切割,所以現在考慮0=t_0<t_1<\dots<t_N=T\Delta\mathbf{r}_i:=\mathbf{r}(t_i)- \mathbf{r}(t_{i-1})\Delta t:=t_i-t_{i-1},我們能寫出黎曼和\sum_{i}|\frac{\Delta\mathbf{r}_i}{\Delta t_i}|^2\Delta t_i。再加上根據定義我們有約束(constraint)\sum_i\Delta t_i-T=0,我們能使用拉格朗日乘數法(Lagrange multiplier)得出讓這個黎曼和達極值時,\frac{d}{d\Delta t_i}\left[\sum_{i}|\frac{\Delta\mathbf{r}_i}{\Delta t_i}|^2\Delta t_i-\lambda\left(\sum_i\Delta t_i-T\right)\right]=-|\frac{\Delta\mathbf{r}_i}{\Delta t_i}|^2-\lambda=0所以|\frac{\Delta\mathbf{r}_i}{\Delta t_i}|^2=-\lambda是常數。

    接著考慮質點在某個位能場V(\mathbf{r})中運動的情形。根據前一段的討論,我們很自然覺得包含位能的理論在算極值時,能用拉格朗日乘數法得出能量守恆的條件。假設\mathbf{r}是光滑的(),根據均值定理(mean value theorem),對所有i都存在\xi_i\in(t_{i-1},t_i)滿足\frac{d\mathbf{r}}{dt}(\xi_i)=\frac{\Delta\mathbf{r}_i}{\Delta t_i},而我們最後希望得出的能量守恆就應該是\frac{1}{2}m|\frac{d\mathbf{r}}{dt}(\xi_i)|^2+V(\mathbf{r}(\xi_i))= \frac{1}{2}m|\frac{\Delta\mathbf{r}_i}{\Delta t_i}|^2+V(\mathbf{r}(\xi_i))=-\lambda是常數。所以把黎曼和改寫成\sum_{i}|\frac{1}{2}m\frac{\Delta\mathbf{r}_i}{\Delta t_i}|^2-V(\mathbf{r}(\xi_i))\Delta t_i,最後再取N\to\infty\max_i\{\Delta t_i\}\to0兩個極限得到\int_0^T\frac{1}{2}m|\frac{d\mathbf{r}}{dt}|^2-V(\mathbf{r})dt,就是既滿足能量守恆、位能為常數時也會退化為自由質點情形的理論。

    上式中被積分的東西就被定義為拉格朗日量(Lagrangian)L,而在前面討論古典力學的情形就會得出L=\frac{1}{2}m|\frac{d\mathbf{r}}{dt}|^2-V(\mathbf{r})是動能減位能。其它理論不一定會得出一樣的結果,我們只能寫出拉格朗日量是由時間t、一組座標\mathbf{q}以及座標對時間的微分\dot{\mathbf{q}}決定的函數。

    要解決這種找出會讓積分達到極值的路徑這種問題,需要引入一個新工具叫做變分法。

 

變分法(Calculus of Variations)

    我們現在希望找出能讓J[\mathbf{q}(t)]:=\int_0^T L(\mathbf{q},\dot{\mathbf{q}},t)dt達到極值的\mathbf{q}(t),已知條件是\mathbf{q}(0)\mathbf{q}(T)。我們設\mathbf{q}(t)為達成極值的路徑、其它可能的路徑寫成\tilde{\mathbf{q}}(t)= \mathbf{q}(t)+\epsilon\mathbf{\eta}(t),其中\mathbf{\eta}(t)是所有滿足\mathbf{\eta}(0)= \mathbf{\eta}(T)=0的光滑函數。極值的條件很自然會給我們\frac{d}{d\epsilon}J[\mathbf{q}(t)+\epsilon\mathbf{\eta}(t)]|_{\epsilon=0}=0。我們試著解這個式子,交換微積分次序並使用分布積分可得\int_0^T\sum_i\left(\frac{\partial L}{\partial q_i}-\frac{d}{dt}\frac{\partial L}{\partial\dot{q}_i}\right)\eta_i(t)dt=0

    在解這個問題前,先看更一般性的情形:一個函數f\in C^\infty[a,b](指在[a,b]上光滑的函數),如果對所有在a,b兩點為零的函數h\in C^\infty[a,b]皆滿足\int_a^b f(x)h(x)dx=0,則f(a,b)上為零

    證明只需要找出f(a,b)上為零才能讓積分為零的h。考慮函數r\in C^\infty[a,b]滿足r(a)=r(b)=0r(x)>0對所有x\in(a,b),並設h(x)=f(x)r(x),則\int_a^b f(x)^2r(x)dx=0,因此f^2(a,b)上為零。

    將上面的引理用在原本的問題上,我們可得\frac{\partial L}{\partial q_i}-\frac{d}{dt}\frac{\partial L}{\partial\dot{q}_i}=0。這個式子被稱為歐拉-拉格朗日方程式(Euler-Lagrange equation),而在物理上、L是拉格朗日量時被稱為拉格朗日方程式(Lagrange equation)

    下一篇文章會談到,通常我們需要初始的\mathbf{q}\dot{\mathbf{q}}來解微分方程,而最小作用量給我們用起訖的\mathbf{q}來解問題的方法。此外,最小作用量可以獲得很多關於對稱性的資訊,但這是之後文章的話題了。

 

再談測地線

(〈時空與幾何(一)〉)

    測地線是能讓\int_C\sqrt{g_{\mu\nu}dx^\mu dx^\nu}最小的路徑,如果我們希望解出來的路徑對參數是等速的,那我們可以考慮讓\int_0^Tg_{\mu\nu}\frac{dx^\mu}{dt}\frac{dx^\nu}{dt}dt最小的路徑(各位可以想想看原因,觀察一下這裡跟一開始自由質點的關係)。用歐拉-拉格朗日方程式,我們可得\frac{d}{dt}\frac{\partial}{\partial\dot{x}^\rho}(g_{\mu\nu}\dot{x}^\mu\dot{x}^\nu)-\frac{\partial}{\partial x^\rho}(g_{\mu\nu}\dot{x}^\mu\dot{x}^\nu)=2g_{\rho\lambda}\ddot{x}^{\lambda}+\left(\frac{\partial g_{\rho\mu}}{\partial x^\nu}+\frac{\partial g_{\rho\nu}}{\partial x^\mu}-\frac{\partial g_{\mu\nu}}{\partial x^\rho}\right)\dot{x}^\mu\dot{x}^\nu=0。上式就是測地線方程,之後關於幾何的文章會再繼續談相關的主題。

 

:設定光滑主要是為了後面討論方便,其實這裡只需要是一次可微就可以。會是一次可微是因為我們希望過程中不會有速度發散或質點受到的力發散的瞬間。


作者介紹
姚勁宇

曾參加2019年的APhO跟IPhO。

物理跟數學都不太好,加在一起勉勉強強還可以(嗎?),所以在物理的部落格寫了一個數學的專欄。


這一篇我春假就寫完了,提早了快三週,雖然不知道有沒有讓我期中考那幾週好過一點。