Matroids Matheplanet Forum Index
Moderiert von Curufin epsilonkugel
Differentiation » Mehrdim. Differentialrechnung » Ableitung von xᵀx
Autor
Universität/Hochschule J Ableitung von xᵀx
AlexiBumBexi
Neu Letzter Besuch: im letzten Monat
Dabei seit: 22.10.2021
Mitteilungen: 4
  Themenstart: 2021-10-22

Hallo,  ich habe ein "Dimensionsproblem", denn ich verstehe nicht warum die Ableitung von $x^Tx = 2x^T$ ist und nicht $2x$. Angenommen $\vec{x}= \left(\begin{array}{c} a \\ b \\ c \end{array}\right)$, dann folgt mit $x^Tx =a^2+b^2+x^2$, dies abgeleitet entspricht $\frac{\partial}{\partial a} = 2a$, $\frac{\partial}{\partial b} = 2b$ und $\frac{\partial}{\partial c} = 2c$, also dem Gradienten $\nabla_\vec{x} = \left(\begin{array}{c} 2a \\ 2b \\ 2c \end{array}\right) = 2 \left(\begin{array}{c} a \\ b \\ c \end{array}\right) = 2x$. Ich verstehe nicht warum man dennoch $2x^T$ in den meisten Lektüren vorkommt, geschrieben wird, dass man die Dimension beim Ableiten beachten muss $\mathbb{R}^n \rightarrow \mathbb{R}$, kann Jemand helfen?


   Profil
zippy
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.10.2018
Mitteilungen: 2948
  Beitrag No.1, eingetragen 2021-10-22

Das ist ein reines Konventionsproblem. Der Gradient kann mit der Ableitung (aufgefasst als lineare Abbildung $\mathbb R^n\to\mathbb R$) auf zwei Arten zusammenhängen: 1. $f'(\vec x)\,\vec h = \nabla f(\vec x)\,\vec h$ (Matrixprodukt) 2. $f'(\vec x)\,\vec h = \nabla f(\vec x)\cdot\vec h$ (Innenprodukt) Im 1. Fall ist der Gradient ein Zeilenvektor und in deinem Beispiel $=2\vec x^T$, im 2. Fall ein Spaltenvektor und in deinem Beispiel $=2\vec x$. --zippy


   Profil
AlexiBumBexi
Neu Letzter Besuch: im letzten Monat
Dabei seit: 22.10.2021
Mitteilungen: 4
  Beitrag No.2, vom Themenstarter, eingetragen 2021-10-22

Hallo Zippy und danke für die schnelle Antwort, allerdings muss ich noch einmal nachhaken. Wir bleiben bei meinem Beispiel: Beim Matrixprodukt rechnet man ja $x^Tx = \left(\begin{array}{c} a & b & c \end{array}\right) \left(\begin{array}{c} a \\ b \\ c \end{array}\right) = =a^2+b^2+x^2$. Und beim Innenprodukt/Skalarprodukt doch aber $x\cdot x = \left(\begin{array}{c} a \\ b \\ c \end{array}\right) \cdot \left(\begin{array}{c} a \\ b \\ c \end{array}\right) = a^2+b^2+x^2$, also ohne $x^T$, somit kann doch nur Fall 1 eintreten? Wobei ich dann aber auch nicht verstehe, warum es ein Zeilenvektor sein muss, denn beides läuft ja auch $a^2+b^2+x^2$ hinaus? Grüße Alex


   Profil
zippy
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.10.2018
Mitteilungen: 2948
  Beitrag No.3, eingetragen 2021-10-22

Es geht nicht darum, wie du die Funktion $f(x)=x^Tx$ schreibst, sondern ob du deren Ableitung $f'(x)\,h=2x^Th=2x\cdot h$ mit dem Gradienten $\nabla f(x)$ als $f'(x)\,h=\nabla f(x)\,h$ oder als $f'(x)\,h=\nabla f(x)\cdot h$ ausdrückst. Ein Koeffizientenvergleich liefert dann entweder $\nabla f(x)=2x^T$ oder $\nabla f(x)=2x$.


   Profil
AlexiBumBexi hat die Antworten auf ihre/seine Frage gesehen.
AlexiBumBexi hat selbst das Ok-Häkchen gesetzt.

Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2021 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]