変分原理(へんぶんげんり、英語: variational principle)は、変分法を用いた物理学の原理。
特に、
変分原理は積分の形で扱うので、座標系の取り方に依存しない。従って拡張性に優れ、いろいろな分野に応用、利用される。
作用積分S を、
![{\displaystyle S\left[q(t)\right]:=\int _{t_{1}}^{t_{2}}L(q(t),{\dot {q}}(t),t)dt,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a4b2ce4e1e6f2a29ae2a404505670317dff4f219)
とする。L はラグランジアン、q(t) は一般化座標、
はその時間微分、すなわち一般化速度である。ここで、ある時刻t1、t2 において、q(t1)、q(t2) は固定されているとする。
この作用積分 S に対する変分原理は、作用積分に対する停留値問題を考えることであり、
![{\displaystyle \delta S\left[q(t)\right]=\delta \int _{t_{1}}^{t_{2}}L(q(t),{\dot {q}}(t),t)dt=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1a9506fb199ee548d573736f8293d634a0598571)
ということに相当する。
変分は、一般化座標 q を、

と時刻 t 上で δq だけ微小変化させることに相当する。変分におけるこの微小変化は仮想的な変位を与えることであり、これは時間 t に対する微小変位 dq とは異なった概念である。δq は元の経路 q(t) 近傍の別の(仮想的な)経路との差であり、他方、時間変化 dq は経路 q に沿った変化の大きさを表す。
一般化座標 q の微小変化 δq について、始点 t =t1 と終点 t =t2 においては経路が固定されているので、

は常に満たされる。
一般化座標 q の表す経路の変化に伴い、一般化速度
も微小変化する。

ここで、一般化速度の微小変化
は、ある時刻t における、二つの経路での一般化速度の差を表す。

作用積分の変分を計算すると、
![{\displaystyle {\begin{aligned}\delta S\left[q(t)\right]&=S\left[q+\delta q\right]-S\left[q\right]\\&=\int _{t_{1}}^{t_{2}}L(q(t)+\delta q(t),{\dot {q}}(t)+\delta {\dot {q}}(t),t)dt-\int _{t_{1}}^{t_{2}}L(q(t),{\dot {q}}(t),t)dt\\&=\int _{t_{1}}^{t_{2}}\left[L(q+\delta q,{\dot {q}}+\delta {\dot {q}},t)-\left\{L(q,{\dot {q}}+\delta {\dot {q}},t)-L(q,{\dot {q}}+\delta {\dot {q}},t)\right\}-L(q,{\dot {q}},t)\right]dt,\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b5c3f2f1f7c99483d35cb8227f133db7749dec8a)
と変形できる。ここで
および
は充分小さいので、積分中の第一項と第二項、第三項と第四項の組はそれぞれ偏微分の形に書き換えられ、
![{\displaystyle {\begin{aligned}\delta S\left[q(t)\right]&=\int _{t_{1}}^{t_{2}}\left[{\frac {\partial L}{\partial q}}\delta q+{\frac {\partial L}{\partial {\dot {q}}}}\delta {\dot {q}}\right]dt\\&=\int _{t_{1}}^{t_{2}}\left[{\frac {\partial L}{\partial q}}\delta q+{\frac {d}{dt}}\left({\frac {\partial L}{\partial {\dot {q}}}}\delta q\right)-{\frac {d}{dt}}\left({\frac {\partial L}{\partial {\dot {q}}}}\right)\delta q\right]dt\\&=\left.{\frac {\partial L}{\partial {\dot {q}}}}\delta {q}\right|_{t_{1}}^{t_{2}}+\int _{t_{1}}^{t_{2}}\left[{\frac {\partial L}{\partial q}}-{\frac {d}{dt}}\left({\frac {\partial L}{\partial {\dot {q}}}}\right)\right]\delta qdt,\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/102ddb98b842ccd22338e9c0418b7143b40afeb3)
となる。δq (t1) = δq (t2) = 0 から第一項は 0 となる。q(t) の任意の微小変化 δq(t) に対して、作用積分の変分がゼロ δS = 0 である条件として、

を得る。これはオイラー=ラグランジュ方程式になっている。
同様にして変分原理を、幾何光学(光線光学)における光の反射や屈折の問題について適用すれば、フェルマーの原理が得られる。フェルマーの原理において、作用積分に対応するものは空間の 2 点間を結ぶ経路の光路長であり、ラグランジアンに対応するものは屈折率となる。
微分形のガウスの法則、

および静磁場におけるファラデーの電磁誘導の法則、

が成り立つ静電場について、電場
を静電ポテンシャル
で書き直せば[注 1]、

次のポアソン方程式が得られる。

ここで、
は位置
における電荷密度、
は国際単位系における真空の誘電率、
はラプラシアンを表す。
この方程式は、次の
の汎関数
について変分原理を用いることでも得られる。
![{\displaystyle F[\phi ({\boldsymbol {r}})]=\int _{V}\left\{{1 \over 2}\left|\nabla \phi ({\boldsymbol {r}})\right|^{2}-{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\phi ({\boldsymbol {r}})\right\}dV.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f9b611f4e2199de15bc2d25a095c5d2b9c74f791)
積分中の項を
倍した、
は静電場のエネルギー密度であり、
は電荷密度の位置エネルギーである。
境界上
で
として、 汎関数
の変分を考えると、
![{\displaystyle {\begin{aligned}\delta F[\phi ({\boldsymbol {r}})]&=\int _{V}\left\{{1 \over 2}\left|\nabla \left(\phi ({\boldsymbol {r}})+\delta \phi ({\boldsymbol {r}})\right)\right|^{2}-{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\left(\phi ({\boldsymbol {r}})+\delta \phi ({\boldsymbol {r}})\right)\right\}dV-\int _{V}\left\{{1 \over 2}\left|\nabla \phi ({\boldsymbol {r}})\right|^{2}-{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\phi ({\boldsymbol {r}})\right\}dV\\&=\int _{V}\left\{{1 \over 2}\left(\nabla \phi ({\boldsymbol {r}})+\nabla \delta \phi ({\boldsymbol {r}})\right)\cdot \left(\nabla \phi ({\boldsymbol {r}})+\nabla \delta \phi ({\boldsymbol {r}})\right)-{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\delta \phi ({\boldsymbol {r}})-{1 \over 2}\left|\nabla \phi ({\boldsymbol {r}})\right|^{2}\right\}dV\\&=\int _{V}\left\{{1 \over 2}\left(\left|\nabla \phi ({\boldsymbol {r}})\right|^{2}+2\nabla \delta \phi ({\boldsymbol {r}})\cdot \nabla \phi ({\boldsymbol {r}})+\left|\nabla \delta \phi ({\boldsymbol {r}})\right|^{2}\right)-{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\delta \phi ({\boldsymbol {r}})-{1 \over 2}\left|\nabla \phi ({\boldsymbol {r}})\right|^{2}\right\}dV\\&=\int _{V}\left\{\nabla \delta \phi ({\boldsymbol {r}})\cdot \nabla \phi ({\boldsymbol {r}})-{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\delta \phi ({\boldsymbol {r}})\right\}dV\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/50023a98bdc3705e7b4a9beb1dd84b00e63b6033)
と変形できる。ここで、
の二次の項は無視した。ナブラの積の規則より、次の式が成り立つから、

変分は、
![{\displaystyle {\begin{aligned}\delta F[\phi ({\boldsymbol {r}})]&=\int _{V}\left\{\nabla \cdot \left(\delta \phi ({\boldsymbol {r}})\nabla \phi ({\boldsymbol {r}})\right)-\delta \phi ({\boldsymbol {r}})\nabla ^{2}\phi ({\boldsymbol {r}})-{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\delta \phi ({\boldsymbol {r}})\right\}dV\\&=\int _{\partial V}\delta \phi ({\boldsymbol {r}})\nabla \phi ({\boldsymbol {r}})\cdot d{\boldsymbol {S}}-\int _{V}\left\{\nabla ^{2}\phi ({\boldsymbol {r}})+{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\right\}\delta \phi ({\boldsymbol {r}})dV\\&=-\int _{V}\left\{\nabla ^{2}\phi ({\boldsymbol {r}})+{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\right\}\delta \phi ({\boldsymbol {r}})dV\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f5c45833b4734e7b100c0ebb520feafa11f23616)
となる。ここで、ガウスの発散定理および境界上
で静電ポテンシャルの変分
がゼロであることを使った。
このことから、汎関数
の変分が任意の
に対しゼロになる条件は、
![{\displaystyle \delta F[\phi ({\boldsymbol {r}})]=-\int _{V}\left\{\nabla ^{2}\phi ({\boldsymbol {r}})+{\rho ({\boldsymbol {r}}) \over \varepsilon _{0}}\right\}\delta \phi ({\boldsymbol {r}})dV=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ec4de4789adfdc74bc3a3397a785b2334722bbb3)
関数
が領域
上でポアソン方程式、

を満たすことであることが確認できる。
ここではリッツの変分原理 (Ritz variational principle) の応用として、変分原理を用いた基底状態の波動関数の近似について述べる。
ハミルトニアン
の固有状態で、固有値が最小のものを基底状態と呼ぶ。すなわち基底状態は以下の固有値方程式を満たす。

ここで
は基底状態の固有値であり、ハミルトニアンの固有値は系の固有状態のエネルギーを表す。このハミルトニアンについて次のことが言える。
「適当な境界条件を持つ任意の状態
に対するハミルトニアン
の期待値
は、基底状態のエネルギー
よりも常に大きいか等しい。
![{\displaystyle E[\Psi ]={\frac {\left\langle \Psi \right|{\hat {H}}\left|\Psi \right\rangle }{\left\langle \Psi |\Psi \right\rangle }}\geq E_{0}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2c9e1412477912ec690b0abf9a842787ad981182)
等号は
が基底状態
である場合に成り立つ」。
このことは、ハミルトニアン
のエルミート性より、任意の状態がエネルギー固有状態の線形結合で表せることから示される。ハミルトニアンの固有状態
は以下の固有値方程式を満たす。

エネルギー固有状態を基底として状態
を展開すれば、適当な複素数係数を用いて次のように表される。

このときハミルトニアンの期待値は、
![{\displaystyle {\begin{aligned}E[\Psi ]&={\frac {\left\langle \Psi \right|{\hat {H}}\left|\Psi \right\rangle }{\left\langle \Psi |\Psi \right\rangle }}\\&={\frac {\sum _{\lambda }\sum _{\lambda '}\left\langle \psi _{\lambda }\right|c_{\lambda }^{*}{\hat {H}}c_{\lambda '}\left|\psi _{\lambda '}\right\rangle }{\sum _{\lambda }\sum _{\lambda '}\left\langle \psi _{\lambda }\right|c_{\lambda }^{*}c_{\lambda '}\left|\psi _{\lambda '}\right\rangle }}\\&={\frac {\sum _{\lambda }E_{\lambda }\left|c_{\lambda }\right|^{2}\langle \psi _{\lambda }|\psi _{\lambda }\rangle }{\sum _{\lambda }\left|c_{\lambda }\right|^{2}\langle \psi _{\lambda }|\psi _{\lambda }\rangle }}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/48b17bc5de9ec3972a85bd7e045356a5d33f621e)
となる。ここで固有状態の直交性を用いた。

エネルギー固有値について、不等式
が成り立つので、分子の固有値をすべて基底状態の固有値に置き換えれば、
![{\displaystyle E[\Psi ]={\frac {\sum _{\lambda }E_{\lambda }\left|c_{\lambda }\right|^{2}\langle \psi _{\lambda }|\psi _{\lambda }\rangle }{\sum _{\lambda }\left|c_{\lambda }\right|^{2}\langle \psi _{\lambda }|\psi _{\lambda }\rangle }}\geq {\frac {\sum _{\lambda }E_{0}\left|c_{\lambda }\right|^{2}\langle \psi _{\lambda }|\psi _{\lambda }\rangle }{\sum _{\lambda }\left|c_{\lambda }\right|^{2}\langle \psi _{\lambda }|\psi _{\lambda }\rangle }}=E_{0}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b7ed7e736633b7b3745613bd7baa5d9bb55c88c2)
ハミルトニアンの期待値と基底状態のエネルギーに関する不等式が得られる。
この原理によって、任意の状態
に対するハミルトニアンの期待値
の最小値が基底状態のエネルギー
である事が保証され、そのときの状態
が基底状態
であると言える。そのため、もしも基底状態とそのときのエネルギー値を求めたいのであれば、変分法によって
の汎関数
の停留値を求めればよい事になる。変分原理を利用したこの手法を指して「変分原理」と言われる事も多い。
の停留値問題は次のようなものになる。
![{\displaystyle \delta E[\Psi ]=\delta \left({\frac {\langle \Psi |{\hat {H}}|\Psi \rangle }{\langle \Psi |\Psi \rangle }}\right)=0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1792057a90c8b5855dc5a0fcfc098509dd649431)
を適当な試行関数
で表せば、

の変分は、パラメーター
の変分で表される。
![{\displaystyle {\begin{aligned}\delta E[\Psi ]&=\delta \left({\frac {\langle \Psi |{\hat {H}}|\Psi \rangle }{\langle \Psi |\Psi \rangle }}\right)\\&=\delta \left({\frac {\sum _{\lambda }\sum _{\lambda '}c_{\lambda }^{*}c_{\lambda '}\langle \phi _{\lambda }|{\hat {H}}|\phi _{\lambda '}\rangle }{\sum _{\lambda }\sum _{\lambda '}c_{\lambda }^{*}c_{\lambda '}\langle \phi _{\lambda }|\phi _{\lambda '}\rangle }}\right).\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c5796887c57c7d2b92c638a5676384028d8f921b)
ここでハミルトニアンの
表示における行列成分を
、試行関数の内積を
とそれぞれ表すことにすると、次のようになる。
![{\displaystyle {\begin{aligned}\delta E[\Psi ]&=\delta \left({\frac {\sum _{\lambda }\sum _{\lambda '}c_{\lambda }^{*}c_{\lambda '}H_{\lambda ,\lambda '}}{\sum _{\lambda }\sum _{\lambda '}c_{\lambda }^{*}c_{\lambda '}\Phi _{\lambda ,\lambda '}}}\right).\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cf62b250061014e177e7b87215fde12a08685687)
この変分が任意のパラメーターの変分
に対してゼロになることは、各パラメーター
の偏微分がゼロになることと同じなので、

より、次の式を得る。

この斉次方程式が非自明な解を持つためには、ベクトル
にかかる行列
のディターミナントがゼロでなければならない[注 2]。
![{\displaystyle \det \left[\mathrm {H} -E\mathrm {\Phi } \right]=0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9dd931cdbca57a2a76bb912c889aa2c102b97604)
平衡状態において密度行列について変分を考えるギブズの変分原理がある。
- ^ 電場
が静電ポテンシャルの勾配
で書き直せることは、勾配の回転
が恒等的にゼロになることから分かる。
- ^ 行列の各列を列ベクトルで表したとき、それらの列ベクトルが線形従属であれば、すなわちいずれかのベクトルが他のベクトルの定数倍の和として表されるなら、非自明な解が存在する。また、ベクトルの組が線形従属であればディターミナントはゼロになる。