2. Usean muuttujan funktiot

2.5. Ketjusäännöt ja lineaarinen approksimointi

Motivaatio

Yleistetään derivoinnin ketjusääntö 
  \frac{d}{dx}f\big(g(x)\big) = f'\big(g(x)\big)g'(x)
  usean muuttujan funktioille f.

Ketjusääntö liittyy suoraan myös moniin käytännön sovelluksiin. Voidaan ajatella fysikaalista suuretta kuten lämpötilaa tai mekaanisen systeemin kokonaisenergiaa, jotka riippuvat useista eri toissijaisista muuttujista (kuten ajasta, paikasta tai nopeudesta). Nämä muuttujat voivat riippua edelleen kolmansista muuttujista (paikka ja nopeus esimerkiksi ajasta). Halutaan tarkastella kiinnostavan fysikaalisen suureen muutosnopeutta mainittujen kolmansien muuttujien suhteen.

Esimerkki

Retkeilijä liikkuu karttaa käyttäen mäkisessä maastossa. Olkoon (x,y) retkeilijän paikka kartalla, z=f(x,y) kulloinenkin korkeus meren pinnasta ja 
  \mathbf{r}(t)=\left(u(t),v(t)\right)
  retkeilijän paikka kartalla hetkellä t. Retkeilijän paikan korkeus eli etäisyys meren pinnan tasosta hetkellä t on siis yhdistetty funktio 
  z=f\left(u(t),v(t)\right) = g(t).
  Kuinka nopeasti retkelijän paikan korkeus muuttuu ajan kuluessa?

Ilmeisestikin vastaus kysymykseen on funktion g(t) derivaatta. Lasketaan: \begin{align*} \lim_{h\to 0}\frac{g(t+h)-g(t)}{h} &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t))}{h} \\ &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t+h))}{h}\\ &\quad + \lim_{h\to 0}\frac{f(u(t),v(t+h))-f(u(t),v(t))}{h} \end{align*} Yhden muuttujan ketjusäännön perusteella 
  	g'(t)=f_{x}\big(u(t),v(t)\big)u'(t)+f_{y}\big(u(t),v(t)\big)v'(t).

Ketjusäännöt

Olkoon z muuttujien x,y jatkuvasti derivoituva funktio (eli funktio, jolla on jatkuvat 1. kertaluvun osittaisderivaatat). Jos x,y ovat muuttujan t jatkuvasti derivoituvia funktioita, niin 
  	\frac{dz}{dt} = \frac{\partial z}{\partial x}\frac{dx}{dt}
  				+ \frac{\partial z}{\partial y}\frac{dy}{dt}.
  Jos x,y ovat kahden muuttujan s,t jatkuvasti derivoituvia funktioita, niin \begin{equation} \frac{\partial z}{\partial s} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial s} \end{equation} ja \begin{equation} \frac{\partial z}{\partial t} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial t}. \end{equation}

Ketjusäännöt voidaan todistaa soveltamalla tutkittavaan erotusosamäärään lineaarisen approksimaation kaavoja virhetermeineen.

Huom. Derivaatan ketjusääntö voidaan kirjoittaa myös gradientin avulla: Jos \mathbf{r}=(x(t),y(t)), niin \frac{d}{dt}f(\mathbf{r}(t)) = \frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt}=
  \nabla f(\mathbf{r}(t))\cdot \mathbf{r}'(t).

Keskeisiä kysymyksiä:
Mikä on yleinen idea näissä kaavoissa? Kuinka voidaan muodostaa yleisessä tapauksessa laskentakaava yhdistetyn funktion (osittais)derivaatoille?

Ajatellaanpa, että z = f(u,v,t), jossa u = u(x,y) ja v=v(y,t). Tarkastellaan graafina "infinitesimaalisen muutoksen etenemistä" muuttujasta t muuttujaan z kaikkien etenemisreittien kautta.

Kuinka tilanne muuttuu, jos lisäksi x = x(t) ja y= y(t), jolloin z = z(t) ja kysytään kaavaa derivaatalle \frac{d z}{d t}? Saadaan 
  	\frac{\partial z}{\partial t} =  \frac{\partial f}{\partial v}
    	\frac{\partial v}{\partial t}  + \frac{\partial f}{\partial t}
  ja \begin{align*} \frac{d z}{d t} & = \frac{\partial f}{\partial u} \left ( \frac{\partial u}{\partial x} \frac{d x}{d t} + \frac{\partial u}{\partial y} \frac{d y}{d t} \right ) \\ &\quad+ \frac{\partial f}{\partial v} \left ( \frac{\partial v }{\partial t} + \frac{\partial v}{\partial y} \frac{d y}{d t} \right ) + \frac{\partial f}{\partial t}, \end{align*} jossa on yhteensä viisi termiä.

Huomautus. Tässä on käytetty sekä notaatiota \frac{\partial z}{\partial t} että \frac{\partial f}{\partial t}, jotka tarkoittavat eri asiaa!

Esimerkki

Olkoon f\colon \mathbb{R}^2\to\mathbb{R} jatkuvasti derivoituva. Etsitään 
  	\frac{\partial}{\partial x} f(x^2y,x+2y)\text{ ja }
  	\frac{\partial}{\partial y} f(x^2y,x+2y).

Saadaan \begin{align*} \frac{\partial}{\partial x} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial x} (x^2y) \\ &\quad +f_{y}(x^2y,x+2y)\frac{\partial}{\partial x}(x+2y) \\ &= 2xy f_{x}(x^2y,x+2y)+ f_{y}(x^2y,x+2y). \end{align*} Vastaavasti voidaan laskea \begin{align*} \frac{\partial}{\partial y} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial y} (x^2y) \\ & +f_{y}(x^2y,x+2y)\frac{\partial}{\partial y}(x+2y) \\ &= x^2 f_{x}(x^2y,x+2y)+ 2f_{y}(x^2y,x+2y). \end{align*}

Esimerkki
Lämpötila ilmakehässä ({}^\circC) riippuu paikasta (x,y,z) sekä ajasta t. Ajatellaan lämpötilaa näistä parametrista riippuvana funktiona T(x,y,z,t). Jos funktio T esittää sääpalloon liitetyn lämpömittarin mittaamaa lämpötilaa, määritetään T:n muutos ajan suhteen.

Määritetään lämpötilan muutos hetkellä t=1, kun 
  	T(x,y,z,t)=\frac{xy}{1+z}(1+t),
  ja sääpallo etenee reittiä \mathbf{r}(t)=(t,2t,t-t^2). Koska lämpömittarin lukeman muutos riippuu kaikista neljästä parametrista, mitään niistä ei voida jättää huomiotta.

Lämpötilan muutoksen kaavaksi saadaan siten 
  	\frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt}
  	+\frac{\partial T}{\partial y}\frac{dy}{dt}
  	+\frac{\partial T}{\partial z}\frac{dz}{dt}
  	+\frac{\partial T}{\partial t}.
  Koordinaattifunktioiden arvot hetkellä t=1 ovat 
  	x=1,\quad y=2\text{ ja } z=0.
  Koordinaattifunktioiden derivaattojen arvot hetkellä t=1 ovat 
  	\frac{dx}{dt}=1,\quad \frac{dy}{dt}=2\text{ ja } \frac{dz}{dt}=-1.
  Siten hetkellä t=1 saadaan \begin{align*} \frac{\partial T}{\partial x} &= \frac{y}{1+z}(1+t)=4, &&\frac{\partial T}{\partial y} = \frac{x}{1+z}(1+t)=2, \\ \frac{\partial T}{\partial z} &= \frac{-xy}{(1+z)^2}(1+t)=-4, &&\frac{\partial T}{\partial t} = \frac{xy}{1+z}=2. \end{align*} Näin ollen, 
  \frac{dT}{dt}\bigg|_{t=1} = 4\cdot 1 + 2\cdot 2 + (-4) \cdot (-1) +2 = 14.