4. Ääriarvot

4.1. Kriittisten pisteiden luokittelu

Johdanto

Ääriarvojen luokittelu perustuu suureen Δf=f(x+h)f(x) tarkasteluun kriittisessä pisteessä xD. Jos Δf saa vain positiivisia arvoja (kun h on pieni), on piste x minimi ja negatiivisessa tapauksessa maksimi. Jos Δf vaihtaa merkkiä, niin piste x ei ole minimi eikä maksimi. Tämä johtaa funktion f toisen derivaatan tarkasteluun kriittisessä pisteessä.
Yhden muuttujan tapauksessa:

  1. Jos f(x)<0, niin funktiolla f lokaali maksimi pisteessä x.
  2. Jos f(x)>0, niin funktiolla f lokaali minimi pisteessä x.
  3. Jos f(x)=0, niin testi ei anna vastausta, ja kysymys täytyy ratkaista muulla tavoin.
Seuraavaksi yritetään yleistää tätä ajatusta monen muuttujan funktiolle.

Hessen matriisi

Olkoon f:DRnR funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat. Funktion f luonnollinen derivaattakäsite on gradientti, joka itsessään on vektoriarvoinen funktio f:RnRn. Siten funktion f toinen derivaatta on matriisi, jota nimitetään Hessen matriisiksi Hf(x)=[2x21f(x)2x2x1f(x)2xnx1f(x)2x1x2f(x)2x22f(x)2xnx2f(x)2x1xnf(x)2x2xnf(x)2x2nf(x)]. Koska f on kaksi kertaa jatkuvasti derivoituva, derivoinnin järjestystä voidaan vaihtaa, ja kyseinen matriisi on symmetrinen.

Miksi Hessen matriisi kiinnostaa meitä? Kun gradientin avulla voidaan kirjoittaa lineaarinen (ensimmäisen asteen) approksimaatio funktiolle f, niin Hessen matriisilla saadaan kvadraattinen tarkennus: f(x+h)f(x)+hf(x)+12hHf(x)hT, jossa (vaaka)vektori h=(h1,h2,,hn) on pieni.

Tämä kaava on itse asiassa ainoastaan uusi tapa kirjoittaa toisen kertaluvun Taylorin approksimaatio n:n muuttujan funktiolle. Muotoa zTAz oleva lauseke on n×n-neliömatriisille A niin kutsuttu neliömuoto, jossa z on n-pystyvektori.

Kirjoita kaava auki tapauksessa n=2!

Pisteessä, jossa f(x)=0, on voimassa approksimaatio f(x+h)f(x)12hHf(x)hT. Tätä voidaan käyttää hyväksi mahdollisen ääriarvon luokittelussa pisteessä x ajattelemalla, että h0.

Matriisin (ja neliömuodon) definiittisyys

Symmetristä n×n-matriisia A sanotaan positiividefiniitiksi, jos sen kaikki ominaisarvot ovat positiivisia ja negatiividefiniitiksi, jos A on positiividefiniitti. Matriisin sanotaan olevan indefiniitti, jos sen kaikki ominaisarvot ovat nollasta poikkeavia ja sillä on vähintään yksi positiivinen sekä yksi negatiivinen ominaisarvo. Positiivi/negatiividefiniiteillä matriiseilla on monia samoja ominaisuuksia kuin positiivisilla/negatiivisilla reaaliluvuilla.

Symmetrisen matriisin A definiittiys tai indefiniittiys periytyy sitä vastaavalle neliömuodolle.
A on positiividefiniitti xTAx>0 kaikilla nollasta poikkeavilla pystyvektoreilla xRn.
A on negatiividefiniitti xTAx<0 kaikilla nollasta poikkeavilla pystyvektoreilla xRn.
A on indefiniitti xTAx saavuttaa sekä negatiivisia että positiivisia arvoja pystyvektorin x vaihdellessa.

Väite nähdään todeksi ortogonaalidiagonalisoimalla symmetrinen matriisi A muotoon A=UTΛU, jossa diagonaalimatriisi Λ sisältää A:n ominaisarvot.

Toisen derivaatan testi monen muuttajan tapauksessa

Lause. Olkoon f:DRnR funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat kriittisen pisteen xD ympäristössä. Tällöin:
  1. Jos Hf(x) on positiividefiniitti, niin f:llä on lokaali minimi pisteessä x.
  2. Jos Hf(x) on negatiividefiniitti, niin f:llä on lokaali maksimi pisteessä x.
  3. Jos Hf(x) on indefiniitti, niin x on funktion f satulapiste.
  4. Muussa tapauksessa testi ei anna tietoa funktiosta f.

Lause seuraa approksimaatiosta f(x+h)f(x)12hHf(x)hT kun h0. Väite täytyy nimittäin ainoastaan tarkastaa Hessen matriisin määräämälle neliömuodolle.

Esimerkki

Etsitään ja luokitellaan funktion f(x,y,z)=x2y+y2z+z22x kriittiset pisteet.

Yhtälöt kriittisille pisteille ovat 0=fx(x,y,z)=2xy2,0=fy(x,y,z)=x2+2yz,0=fz(x,y,z)=y2+2z. Nämä yhtälöt ratkaisemalla nähdään, että funktion f ainoa kriittinen piste on P=(1,1,1/2).

Lasketaan Hessen matriisi Hf(1,1,1/2)=[220212022] ja lasketaan matriisin ominaisarvot vaikkapa MATLABilla

   >> a = [2 2 0 ; 2 -1 2 ; 0 2 2]
   a =
       2     2     0
       2    -1     2
       0     2     2
   >> eig(a)
   ans =
      -2.7016
       2.0000
       3.7016

Koska ominaisarvoissa on erimerkkisiä lukuja, niin funktiolla f on satulapiste pisteessä P=(1,1,1/2).