Höhere Mathematik

Hesse Matrix

Inhaltsübersicht

Die Hesse Matrix stellt für mehrdimensionale reellwertige Funktionen das Analogon zur 2. Ableitung dar. Um die Hesse Matrix berechnen zu können, werden sämtliche zweiten partiellen Ableitungen der Funktion benötigt. Es können über die Definitheit der Hesse Matrix, die Extremstellen einer Funktion aufgrund ihres Krümmungsverhaltens klassifiziert werden.

Willst Du alles das in weniger als 5 Minuten erklärt bekommen? Dann sieh dir unser Video dazu an!

Definition: Hesse Matrix

Sei U\subset R^n offen und die Funktion f: U→R sei zweimal stetig differenzierbar. Dann ist die Hesse Matrix (auch Hessematrix oder Hessesche Matrix) von f im Punkt x_0\in U die folgende n×n-Matrix:

(Hessf)(x_0) : = (D_i D_j f(x_0 ))_i_,_j_=_1_,_._._._,_n=

\left ( \begin {array} {rrrr}\frac{\partial^2 f}{\partial x_1 \partial x_1} (x_0) & \frac{\partial ^2 f}{\partial x_1 \partial x_2} (x_0) & \cdots & \frac{\partial^2 f}{\partial x_1 \partial x_n} (x_0)\\ \frac{\partial^2 f}{\partial x_2 \partial x_1} (x_0 ) & \frac{\partial^2 f}{\partial x_2 \partial x_2} (x_0 ) & \cdots & \frac{\partial^2 f}{\partial x_2 \partial x_n} (x_0 )\\ \vdots & \vdots & \ddots & \vdots &\frac{\partial ^2 f}{\partial x_n \partial x_1} (x_0 ) & \frac{\partial^2 f}{\partial x_n \partial x_2} (x_0) & \cdots & \frac{\partial^2 f}{\partial x_n \partial x_n} (x_0) \end {array} \right)

Häufig wird die Hesse Matrix auch mit H_f (x_0) abgekürzt.

Symmetrische Hesse Matrix

Da die Funktion zweimal stetig differenzierbar ist, gilt für die partiellen Ableitungen nach dem Satz von Schwarz:

D_i D_j f(x_0) = D_j D_i f(x_0) bzw. \frac{\partial^2 f}{\partial x_i \partial x_j} (x_0)=\frac{\partial ^2 f}{\partial x_j \partial x_i} (x_0)

Das bedeutet, dass die Hessesche Matrix eine symmetrische Matrix ist.

Gradient und Hesse Matrix

Der Gradient der betrachteten Funktion f: \mathbb{R}^n \supset U\rightarrow \mathbb{R} sieht an der Stelle x_0 bekanntlich folgendermaßen aus:

grad(f)(x_0)= \left(\begin{array}{r} \frac{\partial f}{\partial x_1} (x_0)\\ \vdots \\ \frac{\partial f}{\partial x_n} (x_0)\end{array} \right)

Die Totale Ableitung bzw. Jacobi-Matrix des Gradienten grad(f):x\mapsto grad(f)(x) an der Stelle x_0 ergibt dann gerade die transponierte Hesse Matrix:

J_g_r_a_d_(_f_) (x_0)=\left( \begin{array}{rrrr} \frac{\partial^2 f}{\partial x_1 \partial x_1} (x_0) & \frac{\partial^2 f}{\partial x_2 \partial x_1} (x_0) & \cdots & \frac{\partial^2 f}{\partial x_n \partial x_1} (x_0 ) \\ \frac{\partial^2 f}{\partial x_1 \partial x_2} (x_0) & \frac{\partial^2 f}{\partial x_2 \partial x_2} (x_0) & \cdots & \frac{\partial^2 f}{\partial x_n \partial x_2} (x_0)\\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial ^2 f}{\partial x_1 \partial x_n} (x_0) & \frac{\partial^2 f}{\partial x_2 \partial x_n} (x_0) & \cdots & \frac{\partial^2 f}{\partial x_n \partial x_n} (x_0 ) \end{array} \right) =((Hessf)(x_0))^T

Da die zweiten partiellen Ableitungen der Funktion f stetig sind, ist die Hessesche Matrix wie bereits erwähnt symmetrisch und somit entspricht die Jacobi-Matrix des Gradienten genau der Hesse Matrix selbst.

Hesse Matrix berechnen

Zur Berechnung der Hesse Matrix müssen also nur alle möglichen partiellen Ableitungen 2. Ordnung bestimmt werden und in richtiger Reihenfolge in einer Matrix angeordnet werden. Um die Übersicht nicht zu verlieren kann hierfür zunächst der Gradient berechnet und notiert werden. Anschließend muss nur noch die Jacobi-Matrix des Gradienten berechnet werden und man erhält die Hesse Matrix.

Hesse-Matrix berechnen Gradienten berechnen Jacobi-Matrix des Gradienten bestimmen
Hesse-Matrix berechnen

Die Berechnung der Hesse Matrix soll anhand zweier Beispiele vorgeführt werden.

Hesse Matrix Beispiel 1

Im ersten Beispiel soll die Hessesche Matrix der Funktion f(x,y)=x^2∙y+e^5^y an der Stelle x_0=(x,y) berechnet werden. Dazu wird wie bereits beschrieben zunächst der Gradient dieser Funktion bestimmt. Dieser lautet:

grad(f)(x,y)=\left (\begin {array}{r}\frac{\partial f}{\partial x} (x,y)\\ \frac{\partial f}{\partial y} (x,y) \end {array} \right) = \left ( \begin {array} {r} 2x\cdot y \\ x^2+5e^5^y \end{array} \right)

Nun ist die Hesse Matrix gerade die Jacobi-Matrix des Gradienten. Um diese zu bestimmen, werden die partiellen Ableitungen nach x und y der beiden Komponenten grad(f)_1 und grad(f)_2 des Gradienten ermittelt und in richtiger Reihenfolge angeordnet:

J_g_r_a_d_(_f_) (x,y)=\left( \begin{array} {rr} \frac{\partial grad(f)_1}{\partial x} (x,y) & \frac{\partial grad(f)_1}{\partial y} (x,y) \\ \frac{\partial grad(f)_2}{\partial x} (x,y) & \frac{\partial grad(f)_2}{\partial y} (x,y) \end{array} \right)=\left( \begin{array}{rr} 2y & 2x \\ 2x & 5e^5^y \end{array} \right)=

(Hessf)(x,y)

Hier ist noch einmal gut zu erkennen, dass die Hessesche Matrix tatsächlich symmetrisch ist. Diese Tatsache kann als Kontrolle dienen und sollte immer überprüft werden.

Hesse Matrix Beispiel 2

Nun soll die Hesse Matrix der Funktion f(x,y,z)=sin⁡(x^2 )+4y^3 z^2 an der Stelle x_0=(0,1,1) berechnet werden. Da die Funktion von drei Variablen abhängt, wird die zugehörige Hesse Matrix eine 3×3-Matrix sein. Um sie an der Stelle x_0=(0,1,1) zu bestimmen, wird sie zunächst für die allgemeine Stelle x_0=(x,y,z) berechnet und zum Schluss werden die entsprechenden Werte in das Ergebnis eingesetzt. Der Gradient von f an der Stelle x_0=(x,y,z) lautet:

grad(f)(x,y,z)=\left( \begin{array} {r} \frac{\partial f}{\partial x} (x,y,z) \\ \frac{\partial f}{\partial y} (x,y,z) \\ \frac{\partial f}{\partial z} (x,y,z) \end{array} \right )=\left( \begin{array}{r} 2x\cdot cos⁡(x^2) \\ 12 y^2 z^2 \\ 8y^3 z \end {array} \right)

Die Hessesche Matrix an der Stelle x_0=(x,y,z) ist die Jacobi-Matrix dieses Gradienten:

J_g_r_a_d_(_f_) (x,y,z) = \left( \begin{array} {rrr} \frac{\partial grad(f)_1}{\partial x} (x,y,z) & \frac{\partial grad(f)_1}{\partial y} (x,y,z) & \frac{\partial grad(f)_1}{\partial z} (x,y,z) \\ \frac{\partial grad(f)_2)}{\partial x} (x,y,z) & \frac{\partial grad(f)_2}{\partial y} (x,y,z) & \frac{\partial grad(f)_2}{\partial z} (x,y,z) \\ \frac{\partial grad(f)_3}{\partial x} (x,y,z) & \frac{\partial grad(f)_3}{\partial y} (x,y,z) & \frac{\partial grad(f)_3}{\partial z} (x,y,z) \end{array} \right )

Sie lautet demnach:

(Hessf)(x,y,z)= \left( \begin{array} {rrr} 2\cdot cos⁡(x^2)-4x^2\cdot sin⁡(x^2) & 0 & 0 \\ 0 & 24yz^2 & 24y^2 z \\ 0 & 24y^2 z & 8y^3 \end{array} \right )

Auch hier lässt sich mit einem Blick überprüfen, dass die Hesse Matrix symmetrisch ist. Da die Hesse Matrix an der Stelle x_0=(0,1,1) gesucht wird, müssen diese Werte noch für (x,y,z) eingesetzt werden. Das gesuchte Ergebnis lautet somit:

(Hessf)(0,1,1)=\left ( \begin{array} {rrr} 2  & 0 & 0 \\ 0 & 24 & 24 \\ 0 & 24 & 8 \end{array} \right)

Bedeutung der Hesse Matrix

Der Hesse Matrix kommt für mehrdimensionale reellwertige Funktionen eine ähnliche Bedeutung zu wie der 2. Ableitung für reellwertige Funktionen einer Variablen. Das bedeutet, dass mithilfe der Hesse Matrix Aussagen über das Krümmungsverhalten einer Funktion getroffen werden können.

Hesse Matrix Definitheit und Krümmungsverhalten

Es soll die offene Teilmenge U\subset \mathbb {R}^n und eine zweimal stetig differenzierbare Funktion f: U\rightarrow \mathbb {R} betrachtet werden. Für das Krümmungsverhalten auf der konvexen Menge D\subset U gelten folgende Zusammenhänge:

  • f ist auf D genau dann konvex, wenn die Hesse Matrix auf ganz D positiv semidefinit ist.
  • f ist auf D genau dann strikt konvex, wenn die Hesse Matrix auf ganz D positiv definit ist.
  • f ist auf D genau dann konkav, wenn die Hesse Matrix auf ganz D negativ semidefinit ist.
  • f ist auf D genau dann strikt konkav, wenn die Hesse Matrix auf ganz D negativ definit ist.

Die Definitheit einer Matrix A kann mithilfe ihrer Eigenwerte überprüft werden. Es gelten hierfür folgende Zusammenhänge:

  • A ist genau dann positiv (negativ) definit, wenn alle Eigenwerte von A positiv (negativ) sind.
  • A ist genau dann positiv (negativ) semidefinit, wenn alle Eigenwerte ≥0 (≤0) sind.
  • A ist genau dann indefinit, wenn A mindestens einen positiven und einen negativen Eigenwert besitzt.

Für größere Matrizen ist es häufig kompliziert sämtliche Eigenwerte zu bestimmen. In diesem Fall bietet sich das Kriterium der führenden Hauptminoren an. Die führenden Hauptminoren \Delta_1,\Delta_2,…,\Delta_n einer n×n-Matrix sind dabei die Determinanten der Untermatrizen, die dadurch entstehen, dass man sukzessive die letzte Zeile und Spalte der Matrix streicht. Beispielsweise sind die führenden Hauptminoren der Matrix A= \left ( \begin{array}{rrr} 1&2&3 \\ 4&5&6 \\ 7&8&9 \end{array} \right) die Determinanten der drei UntermatrizenA_3= \left( \begin{array} {rrr} 1&2&3 \\ 4&5&6 \\ 7&8&9 \end{array} \right ), A_2=\left( \begin{array}{rr} 1&2 \\ 4&5 \end{array} \right) und A_1=(1):

\Delta_1=det⁡(A_1 ), \Delta_2=det⁡(A_2 ), \Delta_3=det⁡(A_3 )

Das Hauptminoren-Kriterium lautet:

  • A ist genau dann positiv definit, wenn alle führenden Hauptminoren von A positiv sind.
  • A ist genau dann negativ definit, wenn alle ungeraden führenden Hauptminoren von A negativ und alle geraden führenden Hauptminoren von A positiv sind.

Anwendungen der Hesse Matrix

Bekanntlich tritt die 2. Ableitung in der Taylorentwicklung einer Funktion auf und außerdem können mit ihrer Hilfe die Typen der Extremstellen einer Funktion ermittelt werden. In diesen beiden Fällen kommt somit auch die Hessesche Matrix als Analogon der 2. Ableitung zum Einsatz.

Taylorentwicklung

Für die zweimal stetig differenzierbare Funktion f:\mathbb {R}^n\supset U\rightarrow \mathbb{R} lautet die Taylorentwicklung bis zur zweiten Ordnung um den Punkt x_0:

T_3 f(x)=f(x_0 )+(x-x_0 )^T\cdot grad(f)(x_0)+ \frac{1}{2} (x-x_0 )^T\cdot (Hessf)(x_0 )\cdot (x-x_0)

Für reellwertige Funktionen einer Variablen ist dies genau das herkömmliche Taylorpolynom 2. Grades:

T_3 f(x)=f(x_0 )+f'(x_0)\cdot (x-x_0)+\frac{1}{2} f''(x_0)\cdot (x-x_0 )^2

Mit der Hesse Matrix Extremstellen klassifizieren

Mithilfe der Kenntnis über das Krümmungsverhalten einer Funktion, die man aus der Hesse Matrix gewinnen kann, lassen sich die Extremstellen dieser Funktion charakterisieren. Dazu müssen allerdings zunächst die kritischen Punkte der Funktion ermittelt werden. Das sind genau diejenigen Punkte, an denen der Gradient der Funktion verschwindet:

x_0 ist ein kritischer Punkt \Longleftrightarrow grad(f)(x_0)=0

Ob ein kritischer Punkt ein lokales Maximum oder Minimum darstellt, lässt sich häufig mithilfe der Definitheit der Hesse Matrix ermitteln.

  • Ist x_0 ein kritischer Punkt und ist die Hesse Matrix dort positiv definit, dann ist in x_0 ein lokales Minimum der Funktion.
  • Ist x_0 ein kritischer Punkt und ist die Hesse Matrix dort negativ definit, dann ist in x_0 ein lokales Maximum der Funktion.
  • Ist x_0 ein kritischer Punkt und ist die Hesse Matrix dort indefinit, dann ist in x_0 ein Sattelpunkt.
    Ist x_0 ein kritischer Punkt und ist die Hesse Matrix dort semidefinit, so kann auf diese Art und Weise der Charakter der Extremstelle nicht ermittelt werden.
    Anhand zweier Beispiele soll im Folgenden das schrittweise Vorgehen zur Bestimmung der Extrema illustriert werden.

Extremstellen und Hesse Matrix Beispiel 1

Im ersten Beispiel soll die Funktion f(x,y)=x^2+y^2 auf Extremstellen untersucht werden.

Hesse-Matrix Beispiel Graph
Hesse-Matrix Beispiel 1

Dazu müssen zunächst die kritischen Punkte dieser Funktion ermittelt werden. Diese sind gerade die Nullstellen des Gradienten, welcher wie folgt aussieht:

grad(f)(x,y)=\left( \begin{array}{r} \frac{\partial f}{\partial x} (x,y) \\ \frac{\partial f}{\partial y} (x,y) \end{array} \right) =\left( \begin{array} {r} 2x\\ 2y \end{array} \right)

Die Nullstellen dieses Gradienten sind gerade die Lösungen des folgenden Gleichungssystems:

  1. 2x=0
  2. 2y=0

Dieses wird lediglich durch den Punkt x_1=(0,0) gelöst, welcher somit der einzige kritische Punkt der Funktion f ist. An diesem Punkt muss also die Hesse Matrix der Funktion auf Definitheit überprüft werden, um die Art der Extremstelle ermitteln zu können. Hierfür muss die Hessesche Matrix zunächst einmal berechnet werden. Sie lautet:

J_g_r_a_d_(_f_) (x,y)=\left( \begin{array} {rr} \frac{\partial grad(f)_1)}{\partial x} (x,y) & \frac{\partial grad(f)_1)}{\partial y} (x,y) \\ \frac{\partial grad(f)_2}{\partial x} (x,y) & \frac{\partial grad(f)_2}{\partial y} (x,y) \end{array} \right)=\left ( \begin {array} {rr} 2&0 \\ 0&2 \end{array} \right) =

(Hessf)(x,y)

Das bedeutet, dass die Hesse Matrix unabhängig von den beiden Variablen ist und an jeder beliebigen Stelle x_0=(x,y) die Form (Hessf)(x,y)=\left( \begin{array} {rr} 2&0 \\ 0&2 \end{array} \right) besitzt. Das gilt somit auch für die einzige kritische Stelle x_1=(0,0) der Funktion:

(Hessf)(0,0)=\left( \begin{array} {rr} 2&0 \\ 0&2 \end{array} \right)

Diese Matrix muss nun auf Definitheit überprüft werden. Dazu können die Eigenwerte \lambda_1 und \lambda_2 der Matrix bestimmt werden. Diese sind gerade die Nullstellen des charakteristischen Polynoms \chi_(_H_e_s_s_f_)_(_0_,_0_) =(\lambda-2)^2. Es gilt also \lambda_1=\lambda_2=2, was bedeutet, dass die Hesse Matrix an der kritischen Stelle x_1=(0,0) positiv definit ist und demzufolge dort ein Minimum besitzt.

Extremstellen und Hesse Matrix Beispiel 2

Nun sollen die Extrema der Funktion f(x,y)=xy^4-x bestimmt werden.

Hesse-Matrix Beispiel Graph
Hesse-Matrix Beispiel 2

Zunächst werden wieder die kritischen Stellen der Funktion mithilfe des Gradienten bestimmt:

grad(f)(x,y)=\left( \begin{array} {r} \frac{\partial f}{\partial x} (x,y) \\ \frac{\partial f}{\partial y} (x,y) \end{array} \right)=\left( \begin{array} {r} y^4-1 \\ 4xy^3 \end{array} \right)

Dessen Nullstellen sind die Lösungen des folgenden Gleichungssystems:

  1. y^4-1=0
  2. 4xy^3=0

Die Punkte, die dieses Gleichungssystem erfüllen sind: x_1=(0,1) und x_2=(0,-1). Das sind also die kritischen Stellen, für welche die Definitheit der Hesse Matrix untersucht werden muss. Dazu wird im ersten Schritt die Hesse Matrix an der Stelle x_0=(x,y) berechnet:

J_g_r_a_d_(_f_) (x,y)=\left ( \begin{array} {rr} \frac{\partial grad(f)_1)}{\partial x} (x,y) & \frac{\partial grad(f)_1)}{\partial y} (x,y) \\ \frac{\partial grad(f)_2}{\partial x} (x,y) & \frac{\partial grad(f)_2}{\partial y} (x,y) \end{array} \right)=\left( \begin {array} {rr} 0 & 4y^3 \\ 4y^3 & 12xy^2 \end{array} \right)=

(Hessf)(x,y)

Für die Hessesche Matrix an den kritischen Punkten x_1=(0,1) und x_2=(0,-1) gilt also:

(Hessf)(0,1)=\left( \begin{array} {rr} 0&4 \\ 4&0 \end{array} \right)

(Hessf)(0,-1)=\left( \begin{array} {rr} 0&-4\\ -4&0 \end{array} \right)

Nun gilt es diese Matrizen auf Definitheit zu untersuchen. Dazu werden die Eigenwerte als Nullstellen der charakteristischen Polynome \chi_(_H_e_s_s_f_)_(_0_,_1_) =\chi_(_H_e_s_s_f_)_(_0_,_-_1) =\lambda^2-16 bestimmt. Das bedeutet, dass beide Matrizen die Eigenwerte \lambda_1=4 und \lambda_2=-4 besitzen. Das heißt nichts anderes, als dass die Hesse Matrix der Funktion an beiden kritischen Stellen indefinit ist und somit dort einen Sattelpunkt besitzt.


Andere Nutzer halten diese Inhalte aus dem Bereich „Höhere Mathematik“ für besonders klaussurrelevant

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.