4. Ääriarvot

4.3. Lagrangen kertoimet

Lagrangen kertoimet

Usein optimointitehtävissä halutaan asettaa rajoitusehtoja optimoitaville muuttujille. Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty materiaali) A(h,r)=2\pi rh+2\pi r^2 niin, että tilavuus V(r,h)=\pi r^2 h on vakio.

Duaalitehtävä: Halutaan maksimoida purkin tilavuus V(r,h) siten, että pinta-ala A(h,r) on vakio. Primaali- ja duaalitehtävillä on sama ratkaisu. Tämän sanoo maalaisjärkikin, mutta itse asiassa ratkaisuun johtavat yhtälötkin ovat (olennaisesti) samoja.

Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä (a,b) vektorien \nabla f ja \nabla g on oltava joko yhdensuuntaisia tai vastakkaissuuntaisia (mikäli \nabla g(a,b) \neq 0). Miksi? Koska muussa tapauksessa funktiolla f olisi nollasta poikkeva suunnattu derivaatta käyrän g(x,y)=0 tangentin suuntaan pisteessä (a,b), ja siis minimi ei voi olla pisteessä (a,b).

Entä jos tehtävänä olisi maksimoida f(x,y) ehdolla g(x,y)=0? Entä jos tehtävänä olisi maksimoida g(x,y) ehdolla f(x,y)=c?

Mikäli optimipiste on olemassa, se on Lagrangen funktion 
  L(x,y,\lambda) = f(x,y) + \lambda g(x,y)
  kriittinen piste (eli gradientin nollakohta). Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen muuttujan tapauksessa Lagrangen funktio on 
  L(x,y,z,\lambda,\mu) = f(x,y,z) + \lambda g(x,y,z) + \mu  h(x,y,z),
  missä f on minimoitava funktio ja rajoite-ehdot ovat g(x,y,z)=0 sekä h(x,y,z)=0.

Esimerkki

Minimoidaan funktio f(x,y)=x^2+y^2 ehdolla g(x,y)=x^2y-16=0. Muodostetaan aluksi Lagrangen funktio 
  L(x,y,\lambda)=x^2+y^2+\lambda(x^2y-16).
  Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &=\frac{\partial L}{\partial x} = 2x(1+\lambda y),\\ 0 &=\frac{\partial L}{\partial y} = 2y+\lambda x^2,\\ 0 &=\frac{\partial L}{\partial \lambda}= x^2y-16,\\ \end{align*} joista viimeinen on aina itse rajoitusehto.

Ensimmäisestä yhtälöstä saadaan x=0 tai \lambda y=-1, mutta x=0 on ristiriidassa kolmannen yhtälön kanssa. Siten toisesta yhtälöstä 
  0=2y^2+\lambda yx^2 = 2y^2-x^2.
  Tästä saadaan edelleen x=\pm \sqrt{2}y, ja 2y^3=16 eli y=2. Ääriarvoja (mahdollisia minimejä) on siis kaksi (x,y) =  (\pm 2\sqrt{2},2). Pitää selvittää muilla keinoin, ovatko nämä minimejä vai maksimeja.

Esimerkki

Yritetään etsiä Lagrangen kertoimien menetelmällä funktion f(x,y)=y minimi ehdolla g(x,y)=y^3-x^2=0. Helposti havaitaan, että minimi f(x,y)=0 saavutetaan pisteessä (0,0).

Muodostetaan Lagrangen funktio 
  L(x,y,\lambda)=y+\lambda(y^3-x^2).
  Saadaan yhtälöt 
  -2\lambda x =0,\quad 1+3\lambda y^2=0,\text{ ja } y^3-x^2=0.
  Nämä yhtälöt ovat keskenään ristiriidassa, joten ratkaisua niille ei ole. Huomaa, että \nabla g(0,0) =\mathbf{0} minimipisteessä. Tästä nähdään, että Lagrangen kertoimet näkevät ääriarvoja vain pisteissä, joissa \nabla g(0,0) \neq \mathbf{0}.

Esimerkki

Etsitään ääriarvot funktiolle f(x,y,z)=xy+2z ehdoilla x+y+z=0 ja x^2+y^2+z^2=24.

Koska f on jatkuva ja annettujen leikkausjoukkojen leikkaus on ympyräviiva (eli rajoitettu ja suljettu joukko), niin ääriarvot ovat olemassa. Muodostetaan Lagrangen funktio 
  L(x,y,z,\lambda,\mu)=xy+2z+\lambda(x+y+z)+\mu(x^2+y^2+z^2-24).
  Lagrangen funktion osittaisderivaatoista saadaan yhtälöt \begin{align*} & y+\lambda+2\mu x=0, \\ & x+\lambda+2\mu y=0, \\ & 2+\lambda+2\mu z=0, \\ & x+y+z = 0,\text{ ja } \\ & x^2+y^2+z^2-24=0. \end{align*} Kahden ensimmäisen yhtälön erotus johtaa yhtälöön (x-y)(1-2\mu)=0, joten joko \mu = 1/2 tai x=y. Tutkitaan molemmat tapaukset.

Tapaus I (\mu = 1/2): Toisen ja kolmannen yhtälön perusteella 
  x+\lambda +y =0\textrm{ ja } 2+\lambda +z =0,\text{ siis }x+y=2+z.
  Neljännestä yhtälöstä saadaan z=-1 ja x+y=1. Viimeisen yhtälön perusteella x^2+y^2=24-z^2=23. Koska x^2+y^2+2xy=(x+y)^2 =1, saadaan 2xy=1-23=-22 ja xy=-11. Nyt (x-y)^2 = x^2+y^2-2xy = 23+22=45, joten x-y=\pm 3\sqrt{5}. Yhdessä yhtälön x+y=1 kanssa tästä saadaan kaksi kriittistä pistettä 
  P_1 = \big((1+3\sqrt{5})/2,(1-3\sqrt{5})/2,-1\big)\text{ ja }
  P_2 = \big((1-3\sqrt{5})/2,(1+3\sqrt{5})/2,-1\big).
  Kummassakin pisteessä f(x,y,z)=-11-2 = -13.

Tapaus II (x=y): Neljännestä yhtälöstä nähdään, että z=-2x, ja viimeisen yhtälön perusteella 6x^2=24 eli x=\pm 2. Näin ollen, kriittiset pisteet ovat 
  P_3=(2,2,-4)\text{ ja } P_4=(-2,-2,4).
  Saadaan 
  f(2,2,-4)=4-8=-4\text{ ja } f(-2,-2,4)=4+8=12.
  Siten funktion f maksimi on 12 ja minimi -13.