費馬(Pierre de Fermat,1601-1665)於1662年提出的費馬原理(Fermat’s principle),將幾何光學中的幾個現象:光在同一介質中會直線前進、反射定律、司乃耳定律(Snell’s Law,就是折射定律),用「光會走耗時最短路徑」一句話就統合起來。我們能不能也將原本的牛頓力學視為最小化某個量值的結果呢?
最小作用量原理(Principle
of Least Action)
首先根據牛頓第一運動定律,自由質點會進行等速直線運動。我們都知道直線就是兩點之間的最短距離,所以可以先很自然地寫下應該要最小化類似∑Ni=1|Δri|的東西,其中Δri:=r(iNT)−r(i−1NT)、T是總時長。但很明顯這樣只保證直線,還少了等速這個結果。不過仔細觀察一下就會發現改成最小化∑Ni=1|Δri|2就能同時得到直線運動和等速兩個結果。當然,我們需要N→∞才會得出結果,所以實際上是討論最小化limN→∞NT∑Ni=1|Δri|2=limN→∞∑Ni=1|ΔriT/N|2TN=∫T0|drdt|2dt。
當然,求黎曼和不一定要用等距的切割,所以現在考慮0=t0<t1<⋯<tN=T、Δri:=r(ti)−r(ti−1)和Δt:=ti−ti−1,我們能寫出黎曼和∑i|ΔriΔti|2Δti。再加上根據定義我們有約束(constraint)∑iΔti−T=0,我們能使用拉格朗日乘數法(Lagrange multiplier)得出讓這個黎曼和達極值時,ddΔti[∑i|ΔriΔti|2Δti−λ(∑iΔti−T)]=−|ΔriΔti|2−λ=0,所以|ΔriΔti|2=−λ是常數。
接著考慮質點在某個位能場V(r)中運動的情形。根據前一段的討論,我們很自然覺得包含位能的理論在算極值時,能用拉格朗日乘數法得出能量守恆的條件。假設r是光滑的(注),根據均值定理(mean value theorem),對所有i都存在ξi∈(ti−1,ti)滿足drdt(ξi)=ΔriΔti,而我們最後希望得出的能量守恆就應該是12m|drdt(ξi)|2+V(r(ξi))=12m|ΔriΔti|2+V(r(ξi))=−λ是常數。所以把黎曼和改寫成∑i|12mΔriΔti|2−V(r(ξi))Δti,最後再取N→∞和maxi{Δti}→0兩個極限得到∫T012m|drdt|2−V(r)dt,就是既滿足能量守恆、位能為常數時也會退化為自由質點情形的理論。
上式中被積分的東西就被定義為拉格朗日量(Lagrangian)L,而在前面討論古典力學的情形就會得出L=12m|drdt|2−V(r)是動能減位能。其它理論不一定會得出一樣的結果,我們只能寫出拉格朗日量是由時間t、一組座標q以及座標對時間的微分˙q決定的函數。
要解決這種找出會讓積分達到極值的路徑這種問題,需要引入一個新工具叫做變分法。
變分法(Calculus
of Variations)
我們現在希望找出能讓J[q(t)]:=∫T0L(q,˙q,t)dt達到極值的q(t),已知條件是q(0)和q(T)。我們設q(t)為達成極值的路徑、其它可能的路徑寫成˜q(t)=q(t)+ϵη(t),其中η(t)是所有滿足η(0)=η(T)=0的光滑函數。極值的條件很自然會給我們ddϵJ[q(t)+ϵη(t)]|ϵ=0=0。我們試著解這個式子,交換微積分次序並使用分布積分可得∫T0∑i(∂L∂qi−ddt∂L∂˙qi)ηi(t)dt=0。
在解這個問題前,先看更一般性的情形:一個函數f∈C∞[a,b](指在[a,b]上光滑的函數),如果對所有在a,b兩點為零的函數h∈C∞[a,b]皆滿足∫baf(x)h(x)dx=0,則f在(a,b)上為零。
證明只需要找出f在(a,b)上為零才能讓積分為零的h。考慮函數r∈C∞[a,b]滿足r(a)=r(b)=0和r(x)>0對所有x∈(a,b),並設h(x)=f(x)r(x),則∫baf(x)2r(x)dx=0,因此f2在(a,b)上為零。
將上面的引理用在原本的問題上,我們可得∂L∂qi−ddt∂L∂˙qi=0。這個式子被稱為歐拉-拉格朗日方程式(Euler-Lagrange equation),而在物理上、L是拉格朗日量時被稱為拉格朗日方程式(Lagrange equation)。
下一篇文章會談到,通常我們需要初始的q和˙q來解微分方程,而最小作用量給我們用起訖的q來解問題的方法。此外,最小作用量可以獲得很多關於對稱性的資訊,但這是之後文章的話題了。
再談測地線
(見〈時空與幾何(一)〉)
測地線是能讓∫C√gμνdxμdxν最小的路徑,如果我們希望解出來的路徑對參數是等速的,那我們可以考慮讓∫T0gμνdxμdtdxνdtdt最小的路徑(各位可以想想看原因,觀察一下這裡跟一開始自由質點的關係)。用歐拉-拉格朗日方程式,我們可得ddt∂∂˙xρ(gμν˙xμ˙xν)−∂∂xρ(gμν˙xμ˙xν)=2gρλ¨xλ+(∂gρμ∂xν+∂gρν∂xμ−∂gμν∂xρ)˙xμ˙xν=0。上式就是測地線方程,之後關於幾何的文章會再繼續談相關的主題。
注:設定光滑主要是為了後面討論方便,其實這裡只需要是一次可微就可以。會是一次可微是因為我們希望過程中不會有速度發散或質點受到的力發散的瞬間。
曾參加2019年的APhO跟IPhO。
物理跟數學都不太好,加在一起勉勉強強還可以(嗎?),所以在物理的部落格寫了一個數學的專欄。
這一篇我春假就寫完了,提早了快三週,雖然不知道有沒有讓我期中考那幾週好過一點。