|
Autor |
"Pushforward measure form" und Helmholtzsche freie Energie |
|
SteinEin
Aktiv  Dabei seit: 21.04.2014 Mitteilungen: 45
 | Themenstart: 2023-10-01
|
Tag zusammen,
ich lese gerade ein Buch ueber statistische Mechanik ("Free energy computations - a mathematical perspective").
Wir betrachten ein System mit Ortskoordinaten \(q\in \mathcal{D}\subset\IR^{3N}\) und Geschwindigkeiten \(p\in \IR^{3N}\). 3N steht fuer 3 Dimensionen und N Teilchen.
Im "kanonischen Ensemble" sind dies Zufallsvariablen mit Verteilung
\(\mu(dqdp)=\frac{1}{Z_{\mu}}e^{-H(q,p)}dqdp\), mit skalarer Hamilton-Funktion H (dies ist die Gesamtenergie des Systems) und Normalisierungskonstante \(Z_{\mu}\).
Da die Dimensionalitaet 3N haeufig zu groß ist, um praktische Fragestellungen anzugehen, fuehrt man sogenannte Reaktionskoordinaten \(\xi: \mathcal{D} \to \IR^{m}\) mit \(m<<3N\) ein und beschreibt das System in dieser reduzierten Form.
Die Level-Mengen von \(\xi\) seien \(\Sigma(z)=\{q\in \mathcal{D}| \xi(q)=z\}\) und es gelte \(\mathcal{D}=\bigcup_{z}\Sigma(z)\),
\(\Sigma(z_1)\not=\Sigma(z_2)\) fuer \(z_1\not=z_2\), und \(\Sigma(z)\) ist einfach zusammenhaengend.
Im Buch wird nun gesagt, dass die Verteilung von \(\xi\) gegeben ist durch
\[\mu^{\xi}(dz)=\Big( \frac{1}{Z_\mu} \int_{\Sigma(z)\times \IR^{3N}} e^{-H(q,p)}\delta_{\xi(q)-z}(dq)dp \Big) dz,\] wobei \(\delta_{\xi(q)-z}(dq):=\frac{\sigma_{\Sigma(z)}(dq)}{|\nabla \xi{q}|}\) mit \(\sigma_{\Sigma(z)}(dq)\) dem Flaechenmaß, das vom Lebesgue Maß auf der Submanifold \(\Sigma(z)\) induziert wird (bin nicht so sicher mit dieser Begrifflichkeit).
Ferner wird gesagt, dass \(\delta_{\xi(q)-z}(dq)dz = dq\), und dass \(\mu^{\xi}\) einfach das Bildmaß von \(\mu\) unter \(\xi\) ist.
Mir ist nicht ganz klar, wie man auf den Ausdruck fuer \(\mu^{\xi}\) kommt. Intuitiv macht der Ausdruck Sinn. Das \(\delta_{\xi(q)-z}(dq)\) in dem Integral erinnert etwas an die Dirac-Delta-Funktion: Um die Dichte von \(\xi\) an der Stelle z zu bekommen, muss ich saemtliche Wahrscheinlichkeit von q,p aufsummieren, fuer die \(\xi(q)=z\) gilt.
Rigoros mathematisch verstehe ich es aber nicht so ganz.
Das "Bild-Maß" scheint das gleiche zu sein, wie das "Push-Forward" Maß. Laut der Wikipedia-Definition https://en.wikipedia.org/wiki/Pushforward_measure, muesste aber erst mal gelten:
Sei Z eine Borelmenge in \(\IR^{m}\). Dann ist das Push-Forward-Maß gegeben durch
\[\mu^{\xi}(Z):=\mu(\xi^{-1}(Z))=\frac{1}{Z_\mu}\int_{\xi^{-1}(Z)\times \IR^{3N}}{e^{-H(q,p)}dqdp}\] (streng genommen muesste man \(\xi\) dafuer wohl eher definierten als Funktion auf \(\mathcal{D}\times \IR^{3N}\)).
Wie komme ich von hier nun auf die Darstellung von \(\mu^{\xi}\) weiter oben?
vG.
SteinEin
|
Profil
|
semasch
Senior  Dabei seit: 28.05.2021 Mitteilungen: 527
Wohnort: Wien
 | Beitrag No.1, eingetragen 2023-10-04
|
Moin SteinEin,
genauer gilt hier
\quoteon(2023-10-01 00:52 - SteinEin im Themenstart)
Die Level-Mengen von \(\xi\) seien \(\Sigma(z)=\{q\in \mathcal{D}| \xi(q)=z\}\) und es gelte \(\mathcal{D}=\bigcup_{z}\Sigma(z)\),
\(\Sigma(z_1)\not=\Sigma(z_2)\) fuer \(z_1\not=z_2\), und \(\Sigma(z)\) ist einfach zusammenhaengend.
\quoteoff
natürlich sogar $\Sigma(z_1) \cap \Sigma(z_2) = \emptyset$ für $z_1 \neq z_2$, d.h. die $\Sigma(z)$ bilden eine Zerlegung von $\mathcal{D}$.
\quoteon(2023-10-01 00:52 - SteinEin im Themenstart)
Im Buch wird nun gesagt, dass die Verteilung von \(\xi\) gegeben ist durch
\[\mu^{\xi}(dz)=\Big( \frac{1}{Z_\mu} \int_{\Sigma(z)\times \IR^{3N}} e^{-H(q,p)}\delta_{\xi(q)-z}(dq)dp \Big) dz,\] wobei \(\delta_{\xi(q)-z}(dq):=\frac{\sigma_{\Sigma(z)}(dq)}{|\nabla \xi{q}|}\) mit \(\sigma_{\Sigma(z)}(dq)\) dem Flaechenmaß, das vom Lebesgue Maß auf der Submanifold \(\Sigma(z)\) induziert wird (bin nicht so sicher mit dieser Begrifflichkeit).
Ferner wird gesagt, dass \(\delta_{\xi(q)-z}(dq)dz = dq\), und dass \(\mu^{\xi}\) einfach das Bildmaß von \(\mu\) unter \(\xi\) ist.
\quoteoff
Genau genommen ist, wenn $\xi$ auf $\mathcal{D}$ definiert wird, $\mu^{\xi}$ das Bildmaß von (dem Marginalmaß) $\mu^{\pi_{\mathcal{D}}}$ (seines Zeichens das Bildmaß von $\mu$ unter der kanonischen Projektion $\pi_{\mathcal{D}}: \mathcal{D} \times \mathbb{R}^{3N} \to \mathcal{D}, (q,p) \mapsto q$ des Phasenraums auf den Konfigurationsraum des Systems) unter $\xi$.
Um die angegebene Formel für $\mu^{\xi}(\mathrm{d}z)$ verständlich zu machen, illustriere ich ihre Genese im Folgenden im üblichen Physikerstil heuristisch und für den Fall $m = 1$ (ich darf das so schreiben, da ich meines Zeichens (auch, zur Zeit sogar hauptberuflich) Physiker bin), man kann das dann analog für $m > 1$ machen und mit den üblichen Techniken der Maß- und Integrationstheorie rigorosisieren.
Beachte zunächst, dass $\mu^{\xi}(\mathrm{d}z)$ für das kanonische Phasenraummaß der Teilmenge des Phasenraums steht, die zwischen den (infinitesimal separierten) Mengen $\Sigma(z) \times \mathbb{R}^{3N}$ und $\Sigma(z+\mathrm{d}z) \times \mathbb{R}^{3N}$ eingeschlossen wird.
Betrachte nun einen infinitesimalen Hyperzylinder zwischen und orthogonal zu den beiden Niveaumengen $\Sigma(z)$ und $\Sigma(z+\mathrm{d}z)$, der eine Hyperbasis mit dem Oberflächenmaß $\sigma_{\Sigma(z)}(\mathrm{d}\overline{q})$ (zentriert um den Punkt $\overline{q} \in \Sigma(z)$ mit gegenüberliegendem Punkt $\overline{q} + \mathrm{d}h \, n \in \Sigma(z+\mathrm{d}z)$ und Normalvektor $n$ auf $\Sigma(z)$ im Punkt $\overline{q}$ in Richtung von $\Sigma(z+\mathrm{d}z)$) und eine Höhe $\mathrm{d}h$ hat. Dann gilt
\[
\mathrm{d}z = \underbrace{\xi(\overline{q}+\mathrm{d}h \, n)}_{z+\mathrm{d}z}-\underbrace{\xi(\overline{q})}_z = \nabla \xi(\overline{q}) \cdot \mathrm{d}h \, n = \|\nabla \xi(\overline{q})\| \mathrm{d}h,
\]
wobei $\|\nabla \xi(\overline{q})\| = \nabla\xi(\overline{q}) \cdot n$ gilt, weil der Gradient bekanntlich normal auf die Niveaumenge $\Sigma(z)$ steht und in Richtung des stärksten Anstiegs (also von $\Sigma(z+\mathrm{d}z)$) zeigt. Nennen wir das Lebesguemaß des Hyperzylinders $\mathrm{d}q$, so gilt damit
\[
\mathrm{d}q = \sigma_{\Sigma(z)}(\mathrm{d}\overline{q}) \mathrm{d}h = \frac{\sigma_{\Sigma(z)}(\mathrm{d}\overline{q})}{\|\nabla \xi(\overline{q})\|} \mathrm{d}z.
\]
Das kanonische Phasenraummaß einer Teilmenge des Phasenraums, die das kartesische Produkt des betrachteten Hyperzylinders und einer infinitesimalen Teilmenge des Impulsraums mit Lebesguemaß $\mathrm{d}p$ ist, ergibt sich somit zu
\[
\mu(\mathrm{d}q \, \mathrm{d}p) = \frac{1}{Z_\mu} \mathrm{e}^{-\beta H(\overline{q},p)} \mathrm{d}q \, \mathrm{d}p = \frac{1}{Z_\mu} \mathrm{e}^{-\beta H(\overline{q},p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}\overline{q})}{\|\nabla \xi(\overline{q})\|} \mathrm{d}p \, \mathrm{d}z.
\]
Integration über alle $\overline{q} \in \Sigma(z)$ und $p \in \mathbb{R}^{3N}$ ergibt dann $\mu^{\xi}(\mathrm{d}z)$, also
\[
\mu^{\xi}(\mathrm{d}z) = \frac{1}{Z_\mu} \int_{(\overline{q},p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-\beta H(\overline{q},p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}\overline{q})}{\|\nabla \xi(\overline{q})\|} \, \mathrm{d}p \, \mathrm{d}z.
\]
Im Zuge einer rigorosen allgemeinen Behandlung zeigt man, was an der letzten Formel auch abgelesen werden kann, nämlich dass $\mu^{\xi}$ bzgl. des m-dimensionalen Lebesguemaßes absolut stetig ist mit der Radon-Nikodym-Dichte
\[
\frac{\mathrm{d}\mu^{\xi}}{\mathrm{d}z}(z) = \frac{1}{Z_\mu} \int_{(\overline{q},p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-\beta H(\overline{q},p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}\overline{q})}{\sqrt{\det\left(\mathrm{d}\xi(\overline{q})\mathrm{d}\xi(\overline{q})^{\mathrm{T}}\right)}} \, \mathrm{d}p,
\]
wobei im allgemeinen Fall $\|\nabla \xi(\overline{q})\|$ durch $\sqrt{\det\left(\mathrm{d}\xi(\overline{q})\mathrm{d}\xi(\overline{q})^{\mathrm{T}}\right)}$ (dabei handelt es sich um das Oberflächenmaß bzgl. des Lebesguemaßes des von den Gradienten $\nabla \xi_1(\overline{q}), \ldots, \nabla \xi_m(\overline{q})$ der Koordinatenfunktionen von $\xi$ aufgespannten Parallelepipeds, das für $m = 1$ eben zur Länge von $\nabla\xi(\overline{q})$ wird) zu ersetzen ist.
LG,
semasch
Edit: $\beta$ ergänzt.
|
Profil
|
SteinEin
Aktiv  Dabei seit: 21.04.2014 Mitteilungen: 45
 | Beitrag No.2, vom Themenstarter, eingetragen 2023-10-05
|
Moin semasch,
erst mal vielen Dank fuer die ausfuehrliche Erklaerung, ich hatte die Hoffnung schon fast aufgegeben :)
Es gilt also tatsaechlich, dass es einfach das Bildmaß ist, also dass gilt:
\[\mu^{\xi}(dz):=\mu(\xi^{-1}(dz))=\frac{1}{Z_\mu}\int_{\xi^{-1}(z)\times \IR^{3N}}{e^{-H(q,p)}dqdp}=\frac{1}{Z_\mu}\int_{\Sigma(z)\times \IR^{3N}}{e^{-H(q,p)}dqdp}\]
Um Wahrscheinlichkeiten zu berechnen, wuerde ich allerdings gerne eine Radon-Nikodym Dichte haben, sodass ich schreiben kann
\[ \mu^{\xi}(dz)=\rho(z)dz \]
Mit dem "Zylinder-Trick", den du vorgefuehrt hast, schreiben wir also das Lebesgue-Maß \(dq\) um in einen Ausdruck mit \(dz \):
\[\mu^{\xi}(dz)= \frac{1}{Z_\mu} \int_{(\bar{q},p)\in\Sigma(z)\times \IR^{3N}} e^{-H(q,p)}\frac{\sigma_{\Sigma(z)}(d\bar{q})}{|\nabla \xi{q}|}dp dz,\]
und man ist fertig.
Eine Frage noch: Was ist die rigorose Definition von \(\sigma_{\Sigma(z)}(dq) \), also dem Oberflaechenmaß auf \(\Sigma(z)\)?
vG.
SteinEin
|
Profil
|
semasch
Senior  Dabei seit: 28.05.2021 Mitteilungen: 527
Wohnort: Wien
 | Beitrag No.3, eingetragen 2023-10-06
|
\quoteon(2023-10-05 23:24 - SteinEin in Beitrag No. 2)
Es gilt also tatsaechlich, dass es einfach das Bildmaß ist, also dass gilt:
\[\mu^{\xi}(dz):=\mu(\xi^{-1}(dz))=\frac{1}{Z_\mu}\int_{\xi^{-1}(z)\times \IR^{3N}}{e^{-H(q,p)}dqdp}=\frac{1}{Z_\mu}\int_{\Sigma(z)\times \IR^{3N}}{e^{-H(q,p)}dqdp}\]
\quoteoff
Ja, $\mu^{\xi}$ ist das Bildmaß von $\mu$ unter der Abbildung $\xi \circ \pi_{\mathcal{D}}$. In deiner Gleichungskette stimmen allerdings ein paar Sachen nicht. Wenn ich mich wieder (aus Gründen der notationellen Einfachheit) auf $m = 1$ beschränke, gilt vielmehr, wie in Beitrag #1 schon ausgeführt und hergeleitet, die Gleichungskette
\[
\mu^{\xi}(\mathrm{d}z) = \mu\left(\xi^{-1}([z,z+\mathrm{d}z]) \times \mathbb{R}^{3N}\right) \\
= \frac{1}{Z_\mu} \int_{(q,p) \in \xi^{-1}([z,z+\mathrm{d}z]) \times \mathbb{R}^{3N}} \mathrm{e}^{-\beta H(q,p)} \mathrm{d}q \, \mathrm{d}p = \frac{1}{Z_\mu} \int_{(q,p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-\beta H(q,p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}q)}{\|\nabla \xi(q)\|} \, \mathrm{d}p \, \mathrm{d}z.
\]
Für $m > 1$ gibt $\mu^{\xi}(\mathrm{d}z)$ eben nicht das Bildmaß eines infinitesimalen Intervalls, sondern das eines infinitesimalen Hypervolumenelements (etwa das eines infinitesimalen Hyperquaders) an.
\quoteon(2023-10-05 23:24 - SteinEin in Beitrag No. 2)
Um Wahrscheinlichkeiten zu berechnen, wuerde ich allerdings gerne eine Radon-Nikodym Dichte haben, sodass ich schreiben kann
\[ \mu^{\xi}(dz)=\rho(z)dz \]
Mit dem "Zylinder-Trick", den du vorgefuehrt hast, schreiben wir also das Lebesgue-Maß \(dq\) um in einen Ausdruck mit \(dz \):
\[\mu^{\xi}(dz)= \frac{1}{Z_\mu} \int_{(\bar{q},p)\in\Sigma(z)\times \IR^{3N}} e^{-H(q,p)}\frac{\sigma_{\Sigma(z)}(d\bar{q})}{|\nabla \xi{q}|}dp dz,\]
und man ist fertig.
\quoteoff
Ja, es ist ja eine ganz übliche Technik in der (theoretischen) Physik, zum Zwecke der Berechnung einer Größe (hier des kanonischen Phasenraummaßes $\mu^{\xi}(\mathrm{d}z)$)) diese in ein Kontinuum von einfach berechenbaren infinitesimalen Größen (hier der kanonischen Phasenraummaße der infinitesimalen Zylinder, die eine infinitesimale Zerlegung des Bereichs zwischen den beiden Niveaumengen $\Sigma(z)$ und $\Sigma(z+\mathrm{d}z)$ bilden, im kartesischen Produkt mit infinitesimalen Teilmengen des Impulsraums) zu zerlegen und daraus die ursprüngliche Größe mittels Integration zu bestimmen (in der Maß- und Integrationstheorie verwendet man eine analoge Technik, die die rigorose Variante der eben beschriebenen ist, bei der man mit endlichen statt infinitesimalen Zerlegungen samt abschließendem Grenzübergang arbeitet).
Wieder müsste die resultierende Formel, wie in Beitrag #1 schon geschrieben, für $m = 1$ korrekt aber
\[
\mu^{\xi}(\mathrm{d}z) = \underbrace{\frac{1}{Z_\mu} \int_{(q,p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-\beta H(q,p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}q)}{\|\nabla \xi(q)\|} \, \mathrm{d}p}_{\rho(z)} \, \mathrm{d}z.
\]
heißen (den Querstrich über den $q$'s habe ich mir jetzt im Gegensatz zu Beitrag #1 gespart, der diente dort nur der Missverständnisprophylaxe). Wie schon in Beitrag #1 geschrieben und was in der Notation des Buches nicht besonders gut rüberkommt, ist der nur für $m = 1$ gültige Nenner $\|\nabla \xi(q)\|$ für beliebiges $m$ eben durch $\sqrt{\det\left(\mathrm{d}\xi(q)\mathrm{d}\xi(q)^{\mathrm{T}}\right)}$ mit der Ableitungsmatrix $\mathrm{d}\xi(q) = \left(\frac{\partial \xi_i}{\partial q_j}(q)\right)_{i,j}$ zu ersetzen.
\quoteon(2023-10-05 23:24 - SteinEin in Beitrag No. 2)
Eine Frage noch: Was ist die rigorose Definition von \(\sigma_{\Sigma(z)}(dq) \), also dem Oberflaechenmaß auf \(\Sigma(z)\)?
\quoteoff
Es handelt sich um die dir vermutlich aus der Analysis bzw. Maß- und Integrationstheorie bekannte gewöhnliche Definition des vom Lebesguemaß induzierten Oberflächenmaßes von Untermannigfaltigkeiten, wie du sie etwa hier in Abs. 15.6 findest.
LG,
semasch
Edit: $\beta$ ergänzt.
|
Profil
|
SteinEin
Aktiv  Dabei seit: 21.04.2014 Mitteilungen: 45
 | Beitrag No.4, vom Themenstarter, eingetragen 2023-10-08
|
Vielen Dank Semasch,
dann habe ich viel gelernt 🤗
|
Profil
|
SteinEin
Aktiv  Dabei seit: 21.04.2014 Mitteilungen: 45
 | Beitrag No.5, vom Themenstarter, eingetragen 2023-10-09
|
Hallo Semasch,
ich habe doch noch mal eine Frage, zwar nicht ganz genau zum Thema passend, aber nah genug, um es hier zu posten.
Allerdings geht es eher um die Physik.
Wir haben nun das Wahrscheinlichkeitsmaß eine Reaktionskoordinate \(\xi\), naemlich (mit \(m=1\))
\[\mu^{\xi}(dz)=\frac{1}{Z_\mu} \int_{(q,p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-H(q,p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}q)}{\|\nabla \xi(q)\|} \, \mathrm{d}p \, \mathrm{d}z. \]
Nun definiert man die Helmholtz Freie Energie Oberflaeche der Reaktionskoordinate durch \(F(z)\mathrm{d}z=-\beta^{-1} \mathrm{ln}(\mu^{\xi}(\mathrm{d}z)) \), also
\[ F(z)=-\beta^{-1}\mathrm{ln}\Big(\frac{1}{Z_\mu} \int_{(q,p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-H(q,p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}q)}{\|\nabla \xi(q)\|} \, \mathrm{d}p \Big). \]
Die "eigentliche" Helmholtz Freie Energie als thermodynamische Zustandsgroeße ist aber gegeben durch \[F=-\beta^{-1}\mathrm{ln}(Z_{\mu}). \] Sie ist also eine Konstante des entsprechenden NVT-Ensembles.
Ich habe mich nun gefragt, wie \(F(z)\) und \(F\) zusammenhaengen. Wenn \(F\) eine Konstante des Ensembles ist, warum sagt man dann, dass verschiedene Werte \(z\) der Reaktionskoordinate unterschiedliche Freie Energie \(F(z)\) haben?
Es scheint zu gelten, dass
\[ F(z)=-\beta^{-1}\mathrm{ln}\Big( \int_{(q,p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-H(q,p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}q)}{\|\nabla \xi(q)\|} \, \mathrm{d}p \Big) + \beta^{-1}\mathrm{ln}(Z_{\mu}) = g(z) - F, \] fuer eine \(z\)-abhaengige Funktion \(g\).
Es scheint aber keinen einfachen Weg zu geben, um von \(F(z)\) auf \(F\) zu kommen, denn dafuer brauechte man die Nullstelle von \(g(z)\).
|
Profil
|
semasch
Senior  Dabei seit: 28.05.2021 Mitteilungen: 527
Wohnort: Wien
 | Beitrag No.6, eingetragen 2023-10-10
|
Vorab mal habe ich anlässlich deines neuen Anliegens einen Blick in die entsprechende Stelle des genannten Buches geworfen und daraufhin in meinen vorigen Beiträgen in den Exponenten der Exponentialfunktionen überall $\beta$ ergänzt, da die Autoren in ihrem Buch und du in deinem letzten Beitrag offenbar doch nicht, wie von mir ursprünglich geglaubt, mit $\beta = 1$ arbeiten.
\quoteon(2023-10-09 00:29 - SteinEin in Beitrag No. 5)
Nun definiert man die Helmholtz Freie Energie Oberflaeche der Reaktionskoordinate durch \(F(z)\mathrm{d}z=-\beta^{-1} \mathrm{ln}(\mu^{\xi}(\mathrm{d}z)) \), also
\[ F(z)=-\beta^{-1}\mathrm{ln}\Big(\frac{1}{Z_\mu} \int_{(q,p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-H(q,p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}q)}{\|\nabla \xi(q)\|} \, \mathrm{d}p \Big). \]
\quoteoff
Deine zweite Formel ist richtig, die erste jedoch nicht (wie du bei Vergleich mit dem Buch nachprüfen kannst), sie macht noch nicht mal Sinn (da du eine infinitesimale Größe als Argument eines Logarithmus, sprich eine logarithmische Divergenz, rechts darin hast, links jedoch eine infinitesimale Größe). Korrekt lautet die erste Formel bzw. die implizite Definition der mit den Reaktionskoordinaten assoziierten freien Energie $F(z)$ also
\[
\mathrm{e}^{-\beta F(z)} = \rho(z), \tag{1}
\]
Auflösen nach $F(z)$ und Einsetzen von $\rho(z)$ ergibt deine zweite Formel.
Es handelt sich bei $F(z)$ (bis auf den Faktor $\beta$) also einfach um eine negativ logarithmische Version der Radon-Nikodym-Dichte $\rho(z)$ der Zufallsgröße $\xi$. $\rho(z)$ kann als Likelihood-Funktion von $\xi$ interpretiert werden (je größer $\rho(z)$, umso wahrscheinlicher ist es, dass bei Messung von $\xi$ an einem System, das durch das fragliche kanonische Ensemble beschrieben wird, der Wert $z$ als Ergebnis resultiert). Dementsprechend lässt sich $F(z)$ als negative Log-Likelihood-Funktion von $\xi$ interpretieren, was auch die primäre physikalische Relevanz von $F(z)$ ist.
\quoteon(2023-10-09 00:29 - SteinEin in Beitrag No. 5)
Die "eigentliche" Helmholtz Freie Energie als thermodynamische Zustandsgroeße ist aber gegeben durch \[F=-\beta^{-1}\mathrm{ln}(Z_{\mu}). \] Sie ist also eine Konstante des entsprechenden NVT-Ensembles.
\quoteoff
Korrekt, die freie Energie $F$ ist implizit definiert vermöge
\[
\mathrm{e}^{-\beta F} = Z_\mu,
\]
Auflösen nach $F$ gibt die zitierte Formel. $F$ ist also (bis auf den Faktor $\beta$) eine negativ logarithmische Version der kanonischen Zustandssumme $Z_\mu$ bzw. ein negativ logarithmisches Maß für die Anzahl der Zustände im Phasenraum, die dem System zugänglich sind.
\quoteon(2023-10-09 00:29 - SteinEin in Beitrag No. 5)
Ich habe mich nun gefragt, wie \(F(z)\) und \(F\) zusammenhaengen. Wenn \(F\) eine Konstante des Ensembles ist, warum sagt man dann, dass verschiedene Werte \(z\) der Reaktionskoordinate unterschiedliche Freie Energie \(F(z)\) haben?
\quoteoff
Die Tatsache, dass man neben $F$ auch $F(z)$ als (im zweiten Fall die mit den Reaktionskoordinaten $\xi$ assoziierte) freie Energie bezeichnet, leitet sich einfach aus den verwandten Definitionen her. Diese Verwandtschaft sieht man nochmal besser, wenn man (1) mit $\mathrm{d}z$ multipliziert. Es ergibt sich
\[
\mathrm{e}^{-\beta F(z)}\mathrm{d}z = \rho(z)\mathrm{d}z = \mu^\xi(\mathrm{d}z) \\
= \frac{\int_{(q,p) \in \Sigma(z) \times \mathbb{R}^{3N}} \mathrm{e}^{-\beta H(q,p)} \frac{\sigma_{\Sigma(z)}(\mathrm{d}q)}{\|\nabla \xi(q)\|} \, \mathrm{d}p \, \mathrm{d}z}{Z_\mu} = \frac{\int_{(q,p) \in \xi^{-1}([z,z+\mathrm{d}z]) \times \mathbb{R}^{3N}} \mathrm{e}^{-\beta H(q,p)} \mathrm{d}q \, \mathrm{d}p}{Z_\mu}.
\]
Der Zähler des letzten Terms ist die kanonische Zustandssumme, also die Anzahl der dem System zugänglichen Zustände, im Teilbereich $\xi^{-1}([z,z+\mathrm{d}z]) \times \mathbb{R}^{3N}$ der Zustände des Phasenraums, die für $\xi$ einen Wert zwischen $z$ und $z+\mathrm{d}z$ aufweisen (d.h., grob gesprochen, für die $\xi = z$ gilt), der Nenner ist die gesamte kanonische Zustandssumme. Insgesamt steht also der letzte Quotient für den Bruchteil der dem System zugängliche Zustände des Phasenraums, für die, grob gesprochen, $\xi = z$ gilt. $F(z)$ ist nun (bis auf den Faktor $\beta$) ein negativ logarithmisches Maß dafür, analog wie $F$ (bis auf den Faktor $\beta$) ein ebensolches für $Z_\mu$ ist, daher die sehr ähnliche Namensgebung, Notation und Bedeutung.
LG,
semasch
|
Profil
|
SteinEin
Aktiv  Dabei seit: 21.04.2014 Mitteilungen: 45
 | Beitrag No.7, vom Themenstarter, eingetragen 2023-10-10
|
\quoteon(2023-10-10 17:05 - semasch in Beitrag No. 6)
Vorab mal habe ich anlässlich deines neuen Anliegens einen Blick in die entsprechende Stelle des genannten Buches geworfen und daraufhin in meinen vorigen Beiträgen in den Exponenten der Exponentialfunktionen überall $\beta$ ergänzt, da die Autoren in ihrem Buch und du in deinem letzten Beitrag offenbar doch nicht, wie von mir ursprünglich geglaubt, mit $\beta = 1$ arbeiten. \quoteoff
Ich habe weiter oben tatsaechlich versucht, den \(\beta=1\) Fall zu benutzen, war dabei aber nicht ganz konsistent, tut mir Leid!
\quoteon
Deine zweite Formel ist richtig, die erste jedoch nicht (wie du bei Vergleich mit dem Buch nachprüfen kannst), sie macht noch nicht mal Sinn (da du eine infinitesimale Größe als Argument eines Logarithmus, sprich eine logarithmische Divergenz, rechts darin hast, links jedoch eine infinitesimale Größe). Korrekt lautet die erste Formel bzw. die implizite Definition der mit den Reaktionskoordinaten assoziierten freien Energie $F(z)$ also
\[
\mathrm{e}^{-\beta F(z)} = \rho(z), \tag{1}
\]
Auflösen nach $F(z)$ und Einsetzen von $\rho(z)$ ergibt deine zweite Formel.
\quoteoff
Nochmal sorry, ich meinte wohl \(e^{-\beta F(z)}\mathrm{d}z=\mu^{\xi}(\mathrm{d}z)\).
Danke fuer deine Erlaeuterung und die Bestaetigung, dass \(F(z)\) und \(F\) tatsaechlich zwar verwandte, aber unterschiedliche Konzepte sind. Ich bin ein wenig verwundert darueber, dass in dem Buch (und in einem anderen Werk, das ich parallel ansehe) nicht klar erklaert wird, dass die beiden Groeßen trotz gleichen Namens voneinander unterschieden werden muessen und es keinen direkten Weg gibt, von \(F(z)\) auf \(F\) zu schließen. Ich habe mich sogar schon gefragt, ob es vielleicht so ist, dass das Ensemble sich veraendert, wenn sich \(\xi\) veraendert, aber das ist natuerlich Quatsch.
Im gleichen Buch werden aber auch die "alchemischen Uebergaenge" besprochen. Dort hat man keine Reaktionskoordinate \(\xi\), sondern einen sich mit \(\lambda\) veraendernden Hamiltonian \(H_{\lambda}\), und ein Ubergang ist dann definiert durch \(\lambda_1 \to \lambda_2\). Dort scheint es dann tatsaechlich so zu sein, dass sich das Ensemble mit \(\lambda\) veraendert, und die Funktion \(F(\lambda)\) tatsaechlich identisch der thermodynamischen Groeße \(F\) ist.
Vielen Dank nochmal!
SteinEin
|
Profil
| Folgende Antworten hat der Fragensteller vermutlich noch nicht gesehen. Er/sie war noch nicht wieder auf dem Matheplaneten |
semasch
Senior  Dabei seit: 28.05.2021 Mitteilungen: 527
Wohnort: Wien
 | Beitrag No.8, eingetragen 2023-10-14
|
\quoteon(2023-10-10 23:14 - SteinEin in Beitrag No. 7)
Ich habe weiter oben tatsaechlich versucht, den \(\beta=1\) Fall zu benutzen, war dabei aber nicht ganz konsistent, tut mir Leid!
\quoteoff
Kein Problem.
\quoteon(2023-10-10 23:14 - SteinEin in Beitrag No. 7)
Nochmal sorry, ich meinte wohl \(e^{-\beta F(z)}\mathrm{d}z=\mu^{\xi}(\mathrm{d}z)\).
\quoteoff
Kein Problem.
\quoteon(2023-10-10 23:14 - SteinEin in Beitrag No. 7)
Danke fuer deine Erlaeuterung und die Bestaetigung, dass \(F(z)\) und \(F\) tatsaechlich zwar verwandte, aber unterschiedliche Konzepte sind. Ich bin ein wenig verwundert darueber, dass in dem Buch (und in einem anderen Werk, das ich parallel ansehe) nicht klar erklaert wird, dass die beiden Groeßen trotz gleichen Namens voneinander unterschieden werden muessen und es keinen direkten Weg gibt, von \(F(z)\) auf \(F\) zu schließen. Ich habe mich sogar schon gefragt, ob es vielleicht so ist, dass das Ensemble sich veraendert, wenn sich \(\xi\) veraendert, aber das ist natuerlich Quatsch.
\quoteoff
Nein, wie du schon richtig erkannt hast, bleibt bei Verwendung der Reaktionskoordinatenmethode das System und Ensemble gleich.
\quoteon(2023-10-10 23:14 - SteinEin in Beitrag No. 7)
Im gleichen Buch werden aber auch die "alchemischen Uebergaenge" besprochen. Dort hat man keine Reaktionskoordinate \(\xi\), sondern einen sich mit \(\lambda\) veraendernden Hamiltonian \(H_{\lambda}\), und ein Ubergang ist dann definiert durch \(\lambda_1 \to \lambda_2\). Dort scheint es dann tatsaechlich so zu sein, dass sich das Ensemble mit \(\lambda\) veraendert, und die Funktion \(F(\lambda)\) tatsaechlich identisch der thermodynamischen Groeße \(F\) ist.
\quoteoff
Ja, genau, wobei sich im Rahmen dieser Methode nicht nur das Ensemble, sondern sogar das System verändert, da ja der Hamiltonian variiert wird.
LG,
semasch
|
Profil
|
|
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen. Lesen Sie die
Nutzungsbedingungen,
die Distanzierung,
die Datenschutzerklärung und das Impressum.
[Seitenanfang]
|