Differentiaali- ja integraalilaskenta 2

Site: MyCourses
Course: MS-A0201 - Differentiaali- ja integraalilaskenta 2 (TFM), Luento-opetus, 9.1.2024-19.2.2024
Book: Differentiaali- ja integraalilaskenta 2
Printed by: Guest user
Date: Wednesday, 11 December 2024, 10:29 AM

Description

Copyright Harri Hakula, Antti Rasila, Pekka Alestalo

Licence CC BY-SA

1. Taso- ja avaruuskäyrät

Tässä luvussa tutustutaan taso- ja avaruuskäyrien parametrisointeihin, tangentteihin ja kaarenpituuteen.

1.1. Parametrisointi

Parametrisointi

Muodollisesti käyrällä tarkoitetaan parametrisoitua joukkoa C\subset \mathbb{R}^n, n \geq 2, joka voidaan esittää muodossa C=\lbrace \mathbf{r}(t) : t\in I\rbrace = \mathbf{r}(I) = \mathbf{r}\text{:n arvojoukko}, missä I\subset\mathbb{R} on väli ja funktio \mathbf{r}\colon I\rightarrow\mathbb{R}^n on jatkuva. Vektoriarvoisen funktion \mathbf{r} jatkuvuus tarkoittaa, että sen kaikki koordinaattifunktiot ovat jatkuvia missä tahansa kantaesityksessä.

Funktio \mathbf{r}=\mathbf{r}(t) on eräs käyrän C parametrisointi ja I on tätä parametrisointia vastaava parametriväli. Väli I voi olla avoin (a,b), suljettu [a,b] tai puoliavoin (a,b],\,[a,b) ja myös rajoittamaton.

Avaruuskäyrän (n=3) parametrisointi voidaan antaa muodossa \mathbf{r}(t)=(x(t),y(t),z(t)) \in \mathbb{R}^3, \text{ kun } t\in I. Vaihtoehtoisesti voidaan myös käyttää koordinaattimuotoa \mathbf{r}(t)=\begin{cases}x=x(t),\\y=y(t),\qquad t\in I\\z=z(t),\end{cases} tai vektorimuotoa \mathbf{r}(t)	=x(t)\mathbf{i}+y(t)\mathbf{j}+z(t)\mathbf{k}, jossa \mathbf{i}=(1,0,0), \mathbf{j} = (0,1,0), ja \mathbf{k}=(0,0,1) ovat \mathbb{R}^3:n luonnolliset kantavektorit. Myös pystyvektoriesitys [x(t),y(t),z(t)]^T voi olla hyödyllinen, jos parametrisointiin halutaan soveltaa matriisioperaatioita kuten kiertoja tai peilauksia.

Edellä funktion \mathbf{r} jatkuvuus tarkoittaa siis koordinaattifunktioiden x,y,z jatkuvuutta parametrivälillä I.

Huomautus. Samalla käyrällä on useita eri parametrisointeja. Miksi? Kuinka pääset yhdestä parametrisoinnista toiseen?

Esimerkki, suora tasossa

Kahden xy-tason pisteen P_0=(x_0,y_0) ja P_1=(x_1,y_1) kautta kulkeva suora voidaan parametrsioida \mathbf{r}(t)	= \begin{cases}	x(t)=(1-t)x_0+tx_1	\\
  							y(t)=(1-t)y_0+ty_1,	\end{cases} \text{ kun } t\in I=(-\infty,\infty). Havaitaan, että \mathbf{r}(t=0)=(x_0,y_0)\quad \text{ ja }\quad \mathbf{r}(t=1)=(x_1,y_1), joten valitsemalla parametriväliksi I=[0,1] saadaan pisteitä P_0 ja P_1 yhdistävä jana.

Esimerkki, reaalifunktion kuvaaja

Jatkuvan funktion f\colon[a,b]\rightarrow\mathbb{R} kuvaaja y=f(x) voidaan ajatella xy-tason käyränä. Tämä käyrä voidaan parametrisoida \mathbf{r}(t)	=\begin{cases}	x(t)=t	\\
  							y(t)=f(t),	\end{cases} missä t\in[a,b]. Tai vastaavasti vektorimuodossa \mathbf{r}(t)	=x(t)\mathbf{i}+y(t)\mathbf{j}= t\mathbf{i}+f(t)\mathbf{j}.

Esimerkki, Helix-käyrä eli kierrejousi

Helix-käyrä eli kierrejousi voidaan parametrisoida \mathbf{r}(t)=\begin{cases}	x(t)=a\cos t, 			\\ 
    y(t)=a\sin t, \qquad t\in I 	\\ 
    z(t)=bt,				\end{cases} missä a,b > 0 ovat parametreja. Parametri a on jousen säde ja parametria b voidaan ajatella jousen venymänä.

Vaihtoehtoisesti voidaan tietysti tässäkin käyttää myös vektorimuotoa \mathbf{r}(t)=x(t)\mathbf{i}+y(t)\mathbf{j}+z(t)\mathbf{k}
  				=a\cos t\mathbf{i}+a\sin t\mathbf{j}+bt\mathbf{k}.

Suunta

Usein parametriväli on suljettu väli I=[a,b]. On lisäksi mahdollista, että a < b tai  b < a.

Parametrisointi määrää käyrälle positiivisen suunnan, jolloin \mathbf{r}(a) on käyrän alkupiste ja \mathbf{r}(b) sen päätepiste. Käyrää, jonka alku- ja päätepiste ovat samoja kutsutaan umpinaiseksi (engl. 'closed').

Voidaan muodostaa myös vastakkainen parametrisointi, jossa käyrä pysyy samana, mutta sen kulkusuunta vaihtuu. Tällöin myös parametrisointiin liittyvät alku- ja päätepiste vaihtuvat toisikseen.

Esimerkiksi tapauksessa \mathbf{r}\colon[0,1]\rightarrow C vastakkainen parametrisointi \mathbf{r}_{-} saadaan helposti kaavalla \mathbf{r}_{-}(t)=\mathbf{r}(1-t), \quad t\in [0,1].

Esimerkki, ympyrän kehä tasossa

Olkoon P_0=(x_0,y_0) ja r_0>0. P_0-keskisen ja r_0-säteisen ympyrän kehän parametrisoinniksi saadaan \mathbf{r}(t)	=\begin{cases}x(t)=x_0+r_0\cos t,\\ y(t) = y_0+r_0\sin t.\end{cases} Jos halutaan parametrisoida koko kehä, voidaan parametriväliksi valita esimerkiksi [0,2\pi] tai [-\pi,\pi]. Lisäksi havaitaan, että \mathbf{r}(0)=\mathbf{r}(2\pi)=(x_0+r_0,0) ja \mathbf{r}(-\pi)=\mathbf{r}(\pi)=(x_0-r_0,0), joten käyrä on umpinainen.

Suunnistus voidaan vaihtaa päinvastaiseksi korvaamalla t\mapsto -t parametrisoinnissa. Tällöin \cos(-t)=\cos t, \sin(-t)=-\sin t ja \mathbf{r}_{-}(t)=\begin{cases}x(t)=x_0+r_0\cos t,\\ y(t)=y_0-r_0\sin t.\end{cases}

Implisiittinen muoto

Tasokäyrän yhtälö voidaan usein ilmaista myös implisiittisessä muodossa F(x,y)=0, missä F on jokin kahden muuttujan lauseke. Konkreettisia esimerkkejä ovat funktion kuvaaja y=f(x), joka voidaan määritellä muodossa F(x,y)=y-f(x)=0, ja R-säteinen ympyrä F(x,y)=x^2+y^2-R^2=0.

Huomautus. Yleisessä tapauksessa yhtälön F(x,y)=0 määräämä tasojoukko voi olla hyvin yllättävän näköinen. Jos esimerkiksi A\subset\mathbb{R}^2 on mikä tahansa suljettu tasojoukko (reunapisteet kuuluvat joukkoon), niin funktio F(x,y)=\text{ pisteen } (x,y) \text{ pienin etäisyys joukosta } A =\min\big\{\sqrt{(x-x_0)^{2}+(y-y_{0})^2} : (x_{0},y_{0})\in A\big\} on jatkuva, mutta yhtälö F(x,y)=0 esittää koko alkuperäistä joukkoa A.

1.2. Tangenttivektori

Käyrän tangentti

Tarkastellaan 3-ulotteista parametrisointia \mathbf{r}, joka on derivoituva. Tämä tarkoittaa, että vektorin \mathbf{r} jokaisen koordinaattifunktion täytyy olla derivoituva.

Parametriväliä [t,t+\Delta t] vastaava käyrän sekantti on vektori \Delta\mathbf{r}=\mathbf{r}(t+\Delta t) - \mathbf{r}(t). Kun \Delta t \rightarrow 0, niin \Delta\mathbf{r} kääntyy yhä enemmän käyrän tangentin suuntaiseksi, mutta samalla sen pituus kutistuu kohti nollaa. Skaalamalla kertoimella \Delta t saadaan kuitenkin erotusosamäärää vastaava lauseke, josta nähdään, että raja-arvo \mathbf{r}'(t) = \lim_{\Delta t\rightarrow 0} \frac{\Delta \mathbf{r}}{\Delta t} on olemassa ja se voidaan käytännössä laskea kaavalla \mathbf{r}'(t) = x'(t)\mathbf{i}+y'(t)\mathbf{j}+z'(t)\mathbf{k}. Vektorin \Delta\mathbf{r}/\Delta t ensimmäinen koordinaatti on nimittäin \frac{x(t+\Delta t)-x(t)}{\Delta t} \longrightarrow x'(t), \text{ kun }\Delta t \rightarrow 0, ja samoin käy myös muissa koordinaateissa. Tämän vuoksi määritelmä näyttää järkevältä.

Määritelmä. Jos käyrällä C\subset\mathbb{R}^3 on derivoituva parametrisointi \mathbf{r}, niin pisteessä \mathbf{r}(t)=(x(t),y(t),z(t)) vektori 
  	\mathbf{r}'(t)=x'(t)\mathbf{i}+y'(t)\mathbf{j}+z'(t)\mathbf{k}
  on käyrän tangenttivektori. Tason tapauksessa z-koordinaatti jää tietysti pois.

Fysikaalisessa tulkinnassa \mathbf{v}(t)=\mathbf{r}'(t) on käyrää C pitkin liikkuvan kappaleen hetkellinen nopeus ja \|\mathbf{v}(t)\| kappaleen vauhti hetkellä t. Lisäksi \mathbf{a}(t)=\mathbf{v}'(t)=\mathbf{r}''(t) on kappaleen hetkellinen kiihtyvyys.

Kokeile erilaisia käyrän parametrisointeja. Musta nuoli kuvaa käyrän tangenttivektoria valitulla arvolla.


\mathbf{r}(t) = \begin{cases}\\ \\ \\ \\\end{cases}
x(t)=~,
y(t)=~,
\quad \le t \le .

Huomautus. Tangenttivektorin määritelmästä saadaan lisäksi hyödyllinen approksimaatio: \mathbf{r}'(t)\approx \Delta\mathbf{r}/\Delta t \Leftrightarrow \Delta\mathbf{r}\approx \mathbf{r}'(t)\Delta t, \text{ kun } \Delta t\approx 0. Muistisääntö: Siirtymä on suunnilleen sama kuin alkunopeus kertaa aikavälin pituus.

Esimerkki

Sykloidi kuvaa vierivään renkaaseen tarttuneen hiukkasen ratakäyrää. Se voidaan parametrisoida kulman t avulla muodossa 
  \mathbf{r}(t)=\begin{cases}x(t)=a(t-\sin t)\\ y(t)=a(1-\cos t).\end{cases}
  Tangenttivektoriksi saadaan tällöin 
  	\mathbf{r}'(t) = a(1-\cos t)\mathbf{i}+a\sin t\mathbf{j},
  ja edelleen voidaan ratkaista kiihtyvyys 
  	\mathbf{a}(t)=\mathbf{r}''(t)=a\sin t\mathbf{i} + a\cos t\mathbf{j}.
  Tästä seuraa \|\mathbf{a}(t)\| = \lvert a\rvert = tasaisen pyörimisliikkeen kiihtyvyys.

Pyörivän ympyrän kaarelta valitun pisteen liikerata muodostaa sykloidin

Huomautus. Sykloidin parametrisoinnissa \mathbf{r}'(2\pi n)=\overline{0}, eli hetkellinen nopeus on nolla (niissä kohdissa, joissa hiukkanen koskettaa vierimisalustaa, vrt. yllä.). Tällöin käyrän suunta voi muuttua jyrkästi, vaikka sen parametrisointi onkin jatkuvasti derivoituva.

1.3. Kaarenpituus

Kaarenpituus

Olkoon \mathbf{r}\colon[a,b]\rightarrow\mathbb{R}^n käyrän C jatkuvasti derivoituva parametrisointi. Jos käyrää approksimoidaan sekanteista muodostetulla murtoviivalla ja annetaan approksimaation tihentyä, voidaan havaita murtoviivan pituuden suppenevan kohti kaaren pituutta \ell(C).

Kaarenpituus (tai käyränpituus) voidaankin määrittää integraalina \ell(C)=\int_a^b \|\mathbf{r}'(t)\|\,dt, missä merkintä \|\cdot\| tarkoittaa vektorin (euklidista) normia eli pituutta avaruudessa \mathbb{R}^n. Tapauksessa n=2 on siis \|\mathbf{r}'(t)\| =\sqrt{x'(t)^2+y'(t)^2} .


Perustelu. Olkoot a= t_{0} < t_{1} < \dotsc < t_{n}=b välin [a,b] ositus. Tällöin vektorien \mathbf{r}(t_{k-1}) ja \mathbf{r}(t_{k}) välisen sekanttivektorin lauseke on \Delta \mathbf{r}_{k} = \mathbf{r}(t_{k}) - \mathbf{r}(t_{k-1}) (vrt. aiempaan määritelmään, kun \Delta t = t_{k}-t_{k-1}).

Toisaalta sekanttivektorien pituudelle pätee approksimaatio \|\Delta\mathbf{r}_{k}\| \approx \|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}), joten kaarenpituuden approksimaatioksi n kappaleella sekanttivektoreita saadaan \ell(C) \approx \sum_{k=1}^{n}\|\Delta\mathbf{r}_{k}\| \approx \sum_{k=1}^{n}\|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}). Vaaditaan lisäksi, että jokaisen jakovälin pituus t_{k}-t_{k-1} suppenee kohti nollaa, kun n\to\infty, jolloin edellinen lauseke on funktion \|\mathbf{r}'(t)\| Riemannin summa. Toisaalta, kun jakovälejä tihennetään, lähestyy approksimaatio kaaren todellista pituutta. Näin ollen integraalin määritelmästä seuraa \ell(C) = \lim_{n\to\infty}\sum_{k=1}^{n}\|\mathbf{r}'(t_{k-1})\|(t_{k}-t_{k-1}) = \int_{a}^{b}\|\mathbf{r}'(t)\|\,dt.

', withLabel:true, strokeWidth:2, label:{ fontSize:22, position:'urt' }});*/ function graph(x){ return x-x*x*x/6+x*x*x*x*x/120; } function update(){ board.suspendUpdate(); board.removeObject(arrows); arrows.length = 0; n = s[0].Value(); a = s[1].Value(); b = s[2].Value(); dt = (b-a)/n; for(i=0;i
Kaarenpituuden approksimointia välillä [a,b], kun sekanttivektoreita n kappaletta

Jos käyrän parametrisointi on ainoastaan paloittain jatkuvasti derivoituva, saadaan koko käyrän kaarenpituus laskemalla osien kaarenpituudet yhteen.

Vaikka käyrällä onkin aina äärettömän monta eri parametrisointia, voidaan osoittaa, ettei kaarenpituus riipu (injektiivisen) parametrisoinnin valinnasta eikä suunnasta.

Esimerkki

Määritetään Helix-käyrän \mathbf{r}(t)=(\cos t,\sin t,t) kaarenpituus parametrivälillä t\in[0,2\pi]. Tangenttivektoriksi saadaan

\mathbf{r}'(t)= \mathbf{i}(-\sin t) + \mathbf{j}\cos t + \mathbf{k}, joten \|\mathbf{r}'(t)\| = \sqrt{((-\sin t)^2+\cos^2t+1)}=\sqrt{2}. Kaarenpituudeksi saadaan \ell = \int_0^{2\pi} \|\mathbf{r}'(t)\|dt = 2\sqrt{2}\pi.

Esimerkki

Johdetaan kaava funktion kuvaajan  y=f(x) kaarenpituudelle välillä [a,b]. Asetetaan \mathbf{r}(t)=(t, f(t)), kun t\in[a,b]. Tällöin \mathbf{r}'(t)=(1,f'(t))\quad\text{ ja }\quad \|\mathbf{r}'(t)\| = \sqrt{1+f'(t)^2}, joten kaarenpituudeksi saadaan \ell = \int_a^b \sqrt{1+f'(t)^2}\,dt.

Huomautus. Kaarenpituutta voidaan tutkia myös sellaisille käyrille, joiden parametrisointi on muodostettu rajoittamattomalla välillä tai käyrä on "rajoittamaton" tai "itsensä päälle laskostuva" avoimen parametrivälinsä päätepisteen läheisyydessä. Kaarenpituusintegraalista tulee tällöin epäoleellinen. Jos tämä integraali on suppeneva, niin käyrää kutsutaan suoristuvaksi.

Esimerkki

Olkoot käyrällä parametrisointi \mathbf{r}(t)=(e^{-t},e^{-t}), kun t\in[0,\infty[. Lasketaan tälle kaarenpituus.

Tangenttivektorin \mathbf{r}'(t)=(-e^{-t},-e^{-t}) pituus on \|\mathbf{r}'(t)\|=e^{-t}\sqrt{2}, joten kaarenpituudeksi saadaan nyt

\ell = \int_{0}^{\infty}\|\mathbf{r}(t)\|\,dt = \int_{0}^{\infty}e^{-t}\sqrt{2}\,dt = \sqrt{2}.

(Huom: Kyseinen käyrä on yksikköneliön puoliavoin lävistäjä, joten tulos lienee muutenkin selvä. Toisaalta siinä näkyy myös kaarenpituuden riippumattomuus parametrisoinnin valinnasta.)

2. Usean muuttujan funktiot

Usean muuttujan funktiot

Usean muuttujan reaaliarvoisella funktiolla tarkoitetaan funktiota f:D\rightarrow\mathbb{R}, missä D\subset\mathbb{R}^n, n\geq2 on funktion määrittelyjoukko. Tällainen funktio siis liittää reaalisiin parametreihin x_1,\ldots,x_n reaaliluvun y=f(x_1,\ldots,x_n). Joskus (erityisesti fysiikassa) tällaista funktiota sanotaan skalaarikentäksi.

Esimerkiksi kaava f(r,h)=\pi r^2h määrittelee kahden muuttujan r,h funktion. Tämän funktion arvo on sylinterin tilavuus, kun r on sen säde ja h korkeus. Tähän sovellukseen liittyvä funktion määrittelyjoukko on tason ensimmäinen neljännes, 
	D=\{(r,h)\in \mathbb{R}^2 : r\ge0,\,h\ge 0\}, 
mutta funktion määräävä matemaattinen kaava on kuitenkin määritelty ja mielekäs kaikilla (r,h)\in \mathbb{R}^2, siis myös negatiivisilla luvuilla.

Esimerkki

Funktion z=f(x,y) kuvaaja, kun


f(x,y)=-\frac{6x}{2+x^2+y^2}


f(x,y)=x^2-y^2

Tasa-arvokäyrät

Olkoon c\in\mathbb{R} vakio, D\subset\mathbb{R}^2 ja f\colon D \to \mathbb{R} funktio. Tällöin joukko C= \{(x,y)\in D \mid f(x,y)=c\} on usein tasokäyrä. Kyseinen pistejoukko voi olla myös tyhjä (jos f ei saa arvoa c) tai vaikkapa koko taso (jos f on vakio). Mikäli joukko C on tasokäyrä, sitä sanotaan funktion f arvoon c liittyväksi tasa-arvokäyräksi.

Esimerkiksi korkeuskäyrät kartalla ovat tasa-arvokäyriä funktiolle, joka liittää kartalla olevaan pisteeseen (x,y) maaston korkeuden meren pinnasta kyseisessä pisteessä.

Kolmiulotteisessa tapauksessa f\colon D\to \mathbb{R} pistejoukot S= \{(x,y,z) \in D: f(x,y,z)=c\} ovat yleensä pintoja (eivätkä siis avaruuskäyriä).

Esimerkki
Funktion z=f(x,y)=-\frac{6x}{2+x^2+y^2} tasa-arvokäyriä:


Raja-arvo monen muuttujan tapauksessa

Olkoon D\subset \mathbb{R}^n, n \geq 2 ja f\colon D\to \mathbb{R} funktio. Oletetaan lisäksi, että piste \textbf{y}_0\in \mathbb{R}^n on joukon D kasaantumispiste eli kaikilla r>0 joukko D\cap \{\textbf{x} \in \mathbb{R}^n : 0< \|\textbf{x} - \textbf{y}_0\| < r\} on epätyhjä. Tällöin sanotaan, että funktiolla f on raja-arvo L pisteessä \textbf{y}_0 ja merkitään 
\lim_{\textbf{x} \to \textbf{y}_0} f(\textbf{x})=L, \quad \text{missä } \textbf{x} = (x_1,\ldots,x_n)\in D,
jos kaikilla \varepsilon>0 on olemassa luku \delta = \delta(\varepsilon) siten, että | f(\textbf{x}) -L| aina, kun 0 ja \textbf{x} \in D.

Huomaa, että nimenomaan vaatimus  \textbf{x} \in D mahdollistaa raja-arvon tutkimisen myös funktion määrittelyjoukon reunapisteessä. Lisäksi ehto 0 tarkoittaa vain sitä, että \textbf{x}\neq \textbf{y}_0

, joten funktion arvolla f(\textbf{y}_0) (jos se on edes olemassa) ei ole mitään merkitystä raja-arvon kannalta. Sen sijaan jatkuuvuuden kohdalla tilanne muuttuu kokonaan.
Laskusääntöjä

Olkoot D\subset \mathbb{R}^n, n\geq 2, \textbf{y}_0 joukon D kasaantumispiste ja f,g\colon D \to \mathbb{R} sellaisia funktiota, että \lim_{\textbf{x} \to \textbf{y}_0} f(\textbf{x}) =L ja \lim_{\textbf{x} \to \textbf{y}_0} g(\textbf{x}) =M. Tällöin: 
	\lim_{\textbf{x} \to \textbf{y}_0} \big(f(\textbf{x}) \pm g(\textbf{x})\big) = L \pm M.

	\lim_{\textbf{x} \to \textbf{y}_0} f(\textbf{x}) g(\textbf{x}) = LM.

	\lim_{\textbf{x} \to \textbf{y}_0} \frac{f(\textbf{x})}{g(\textbf{x})} = \frac{L}{M},\text{ jos }M \neq 0.
Jos L\in(a,b) ja F\colon (a,b)\to \mathbb{R} on jatkuva pisteessä L, niin 
	\lim_{\textbf{x} \to \textbf{y}_0} F\big(f(\textbf{x})\big) = F(L).

Raja-arvon tutkiminen käyrien avulla

Yhden muuttujan tapauksessa raja-arvoa tutkitaan yleensä oikean- ja vasemmanpuoleisen raja-arvon avulla. Tämä ajatus ei kuitenkaan toimi usean muuttujan tapauksessa, koska yleensä on olemassa äärettömän monta suuntaa (eli kyseisen pisteen kautta kulkevaa suoraa tai käyrää), joista pistettä \textbf{y}_0 voidaan lähestyä joukossa D\subset \mathbb{R}^n, n\geq2.

Mikäli kuitenkin on olemassa kaksi käyrää \textbf{r}_1,\textbf{r}_2\colon [a,b]\to D\cup \{\textbf{y}_0\}, siten että \textbf{r}_1(b)=\textbf{r}_2(b)=\textbf{y}_0 mutta 
\lim_{t\to b} f\big(\textbf{r}_1(t)\big) \neq \lim_{t\to b} f\big(\textbf{r}_2(t)\big),
tai jompaa kumpaa kyseisistä raja-arvoista ei ole määritelty, niin tällöin funktiolla f\colon D\to\mathbb{R} ei voi olla raja-arvoa pisteessä \textbf{y}_0.

Esimerkki

Tutkitaan funktion f(x,y) raja-arvoa origon ympäristössä, kun 
f(x,y) = \frac{2xy}{x^2+y^2}.

Jos origoa lähestytään x-akselin suunnasta, eli pitkin käyrää \mathbf{r}_1(t)=(t,0), saadaan 
\lim_{t\to0^+}f(t,0) = \lim_{t\to0^+}\frac{2t\cdot 0}{t^2+0^2} = 0.
Toisaalta suoralla x=y, joka voidaan parametrisoida muodossa \mathbf{r}_2(t)=(t,t), saadaan 
\lim_{t\to0^+}f(t,t) = \lim_{t\to0^+}\frac{2t\cdot t}{t^2+t^2} = \lim_{t\to0^+}\frac{2t^2}{2t^2} = 1.
Näin ollen funktiolla f ei ole raja-arvoa origossa.

Esimerkki

Tutkitaan funktion 
f(x,y) = \frac{2x^2y}{x^4+y^2}
raja-arvoa origossa.

Koska funktion arvo on nolla koordinaattiakseleilla, niin sen raja-arvon täytyy olla nolla (jos raja-arvo on olemassa). Itse asiassa kaikilla origon kautta kulkevilla suorilla \mathbf{r}(t)=(t,kt) saadaan 
f(t,kt) = \frac{2kt^3}{t^4+k^2t^2} = \frac{2kt}{t^2+k^2} \to 0, \text{ kun } t\to 0.
Kuitenkin valinnalla \mathbf{r}_1(t) = (t,t^2) saadaan 
\lim_{t\to0}f(t,t^2) = \lim_{t\to0}\frac{2t^4}{t^4+t^4} = 1.
Siten tälläkään funktiolla ei ole raja-arvoa origossa.

Esimerkki
Osoitetaan, että 
\lim_{(x,y)\to(0,0)} \frac{x^2y}{x^2+y^2} = 0.
Käyttämällä epäyhtälöä x^2\leq x^2 + y^2 saadaan 
\left|f(x,y)-0\right| = \left|\frac{x^2y}{x^2+y^2}\right|\leq |y|\leq \sqrt{x^2+y^2} \to 0, \text{ kun } (x,y)\to(0,0).
Tarkemmin: Raja-arvon määritelmän ehto toteutuu, jos valitaan \delta=\epsilon.

Jatkuvuus

Olkoon D\subset \mathbb{R}^n, n\geq 2 ja \textbf{x}_0 \in D. Funktio f\colon D\to \mathbb{R} on jatkuva pisteessä \textbf{x}_0, jos 
	\lim_{\textbf{x} \to \textbf{x}_0} f(\textbf{x}) = f(\textbf{x}_0).
Funktio on jatkuva joukossa D, jos se on jatkuva jokaisessa joukon D pisteessä.

2.1. Osittaisderivaatta

Avoin joukko

Avoimessa joukossa voidaan jokaisesta pisteestä siirtyä ainakin lyhyt etäisyys kaikkiin mahdollisiin suuntiin. Tällaisessa joukossa määritellyn funktion arvojen muutosta voidaan siis tutkia kaikissa eri suunnissa, mikä on tärkeää funktion osittaisderivaattojen tapauksessa. Tarkemmin:
Määritelmä
Joukko D\subset \mathbb{R}^n on avoin, jos sen jokaille pisteelle \mathbf{x}\in D löytyy sellainen r=r_{\mathbf{x}} >0, että 
B(\mathbf{x}, r) = \{\mathbf{y}\in  \mathbb{R}^n\mid \| \mathbf{y}-\mathbf{x}\| < r \}\subset D.
Joukko B(\mathbf{x}, r) on pallo(n sisäpuoli), jonka keskipiste on \mathbf{x} ja säde r. Tasossa käytetään myös nimitystä kiekko, mutta merkintä  B = 'ball' sopii kaikkiin ulottuvuuksiin. Englannin kielen sana 'sphere' käännetään myös palloksi, mutta sekaannusten välttämiseksi siitä on matematiikassa toisinaan hyvä käyttää nimitystä "pallopinta".

Osittaisderivaatta

Olkoon n \geq 2, D\subset \mathbb{R}^n avoin ja f\colon D\to \mathbb{R} funktio. Tällöin kaikille j=1,\ldots,n funktion f osittaisderivaatta muuttujan x_j suhteen on 
  	\frac{\partial}{\partial x_{j}}f(\mathbf{x}) = \lim_{h\to0}\frac{f(\mathbf{x} + h\mathbf{e}_j) -f(\mathbf{x})}{h},
  jos kyseinen raja-arvo on olemassa. Tässä \mathbf{e}_j on j:s yksikkökantavektori.

Huom. Erityisesti tapauksissa \mathbf{x}\in\mathbb{R}^{n} ja n=2 tai n=3 käytetään osittaisderivaatoille yleensä merkintöjä \frac{\partial}{\partial x_{1}}f(\mathbf{x}) = f_{x}(\mathbf{x}),\quad\frac{\partial}{\partial x_{2}}f(\mathbf{x}) = f_{y}(\mathbf{x})
		\quad\text{ja}\quad \frac{\partial}{\partial x_{3}}f(\mathbf{x}) = f_{z}(\mathbf{x})

Esimerkiksi kahden muuttujan funktiolle  f(x,y) on 
f_x(a,b) = \lim_{h\to0}\frac{f(a+ h,b) -f(a,b)}{h}
ja 
f_y(a,b) = \lim_{h\to0}\frac{f(a,b+h) -f(a,b)}{h}.

Käytännössä osittaisderivointi jonkin muuttujan suhteen tapahtuu samaan tapaan kuin yhden muuttujan tapauksessa, muistetaan vain tulkita kaikki muut muuttujat ikään kuin vakioiksi.

Syy: Esimerkiksi kahden muuttujan funktiosta f(x,y) voidaan muodostaa yhden muuttujan funktio  g(t)=f(t,b) kiinnittämällä muuttuja y=b. Tällöin funktion g tavallinen yhden muuttujan erotusosamäärä on sama lauseke kuin funktion f erotusosamäärässä ensimmäisen muuttujan suhteen: 
g'(a) = \lim_{h\to0} \frac{g(a+h)-g(a)}{h} = \lim_{h\to0}\frac{f(a+ h,b) -f(a,b)}{h} 
=  f_x(a,b).

Esimerkki

Olkoon funktio f\colon \mathbb{R}^2\to \mathbb{R}, f(x_{1},x_{2})=x_{1}x_{2}. Tällöin \frac{\partial}{\partial x_{2}}f(x_{1},x_{2}) = \lim_{h\to0}\frac{f(x_{1},x_{2}+h)-f(x_{1},x_{2})}{h} 
		= \lim_{h\to0}\frac{x_{1}(x_{2}+h)-x_{1}x_{2}}{h} = x_{1}.

Esimerkki

Olkoon funktio f\colon \mathbb{R}^2\to \mathbb{R}, f(x,y)=x^2\sin y. Sen osittaisderivaatat ovat 
  	f_{x}(x,y) = 2x\sin y
  \quad \text{ ja }\quad
  	f_{y}(x,y) = x^2 \cos y.

Merkintätavat osittaisderivaatoille

Funktion f\colon D\subset\mathbb{R}^n\to \mathbb{R} osittaisderivaattaa muuttujan x_j suhteen merkitään mm. seuraavilla tavoilla 
  	\frac{\partial}{\partial x_j} f(x_1,\ldots,x_n) = \frac{\partial f}{\partial x_j}
  	= D_jf(x_1,\ldots,x_n) = \partial_{j}f(x_{1},\ldots,x_{n}).

Tapauksessa n=2 usein kirjoitetaan z=f(x,y), jolloin voidaan myös käyttää merkintöjä 
  	f_{x}(x,y)=\frac{\partial z}{\partial x} \quad \text{ ja }\quad
   	f_{y}(x,y)=\frac{\partial z}{\partial y}.

Osittaisderivaatalle käytetään erillistä symbolia \partial ("doo"), jotta se ei sekoittuisi tavalliseen derivaattaan. Tähän palataan vähän myöhemmin ketjusäännön yhteydessä.

Osittaisderivaatan arvo

Funktion f\colon D\subset\mathbb{R}^n\to \mathbb{R} osittaisderivaatan f_j arvoa pisteessä \mathbf{x}_0\in D merkitään 
  	\bigg(\frac{\partial f}{\partial x_j}\bigg)\bigg|_{\mathbf{x}_0} = \frac{\partial z}{\partial x_j}\bigg|_{\mathbf{x}_0} = D_jf(\mathbf{x}_{0}) = \partial_{j}f(\mathbf{x}_{0}),
  jossa muuttuja z määritellään z = f(x_1, x_2, \ldots , x_n).

Esimerkiksi, jos f(u,v)=u^2v ja \mathbf{w} = x^2\mathbf{i} + xy\mathbf{j}, niin \begin{align} f_{u}(\mathbf{w})&=f_{u}(x^2,xy) =\left.\bigg(\frac{\partial}{\partial u}f(u,v)\bigg)\right|_{(x^2,xy)} \\ &=2uv\Big|_{u=x^2,\,v=xy}= 2(x^2)(xy)=2x^3y. \end{align}

Esimerkki

Lasketaan 
  	\frac{\partial z}{\partial x}\quad \text{ ja }\quad \frac{\partial z}{\partial y},
  kun z=x^3y^2+x^4y + y^4. Tällöin saadaan 
  	\frac{\partial z}{\partial x} = 3x^2y^2+4x^3y
  \quad \text{ ja }\quad
  	\frac{\partial z}{\partial y} = 2x^3y+x^4+4y^3.

Esimerkki

Etsitään f_{x}(0,\pi), kun f(x,y)=e^{xy}\cos(x+y). Tästä saadaan 
  	f_{x}(x,y)=ye^{xy}\cos(x+y)-e^{xy}\sin(x+y).
  Siten 
  	f_{x}(0,\pi) = \pi e^0\cos(\pi)-e^0\sin(\pi) = -\pi.

Ketjusäännön soveltaminen

Tavallisiin derivaattoihin liittyvä ketjusääntö 
  (f\circ g)'(x)= f'\big(g(x)\big)g'(x)
  on voimassa myös osittaisderivaattojen tapauksessa. Jos esimerkiksi  f\colon \mathbb{R}\to\mathbb{R} ja g\colon \mathbb{R}^2\to\mathbb{R}, niin 
  \frac{\partial }{\partial x}f\big(g(x,y)\big) = f'\big(g(x,y)\big)g_{x}(x,y)
  ja 
  	\frac{\partial }{\partial y}f\big(g(x,y)\big) = f'\big(g(x,y)\big)g_{y}(x,y).
  Myöhemmin esitetään myös ketjusääntö monen muuttujan funktioille.

Esimerkki

Osoitetaan, että derivoituva funktio f\colon \mathbb{R}\to\mathbb{R} toteuttaa seuraavan osittaisdifferentiaaliyhtälön, kun z=f(x/y): 
  	x\frac{\partial z}{\partial x} + y\frac{\partial z}{\partial y}=0
  Ketjusäännön perusteella 
  	\frac{\partial z}{\partial x} =f'\bigg(\frac{x}{y}\bigg)\bigg(\frac{1}{y}\bigg)
  	\text{ ja }
  	\frac{\partial z}{\partial y} =f'\bigg(\frac{x}{y}\bigg)\bigg(\frac{-x}{y^2}\bigg).
  Siten 
  	x\frac{\partial z}{\partial x} + y\frac{\partial z}{\partial y}
  		= f'\bigg(\frac{x}{y}\bigg)\bigg(x\cdot \frac{1}{y}+y\cdot\frac{-x}{y^2}\bigg)=0.

Korkeammat osittaisderivaatat

Funktiolle f\colon \mathbb{R}^n\to\mathbb{R} voidaan määritellä myös korkeampia osittaisderivaattoja. Jos z=f(x,y), niin saadaan esimerkiksi 
  	\frac{\partial^2 z}{\partial x^2} = \frac{\partial }{\partial x} \frac{\partial z}{\partial x} =f_{xx}(x,y)
  ja 
  	\frac{\partial^2 z}{\partial x\partial y} = \frac{\partial }{\partial x} \frac{\partial z}{\partial y} =f_{yx}(x,y).
  Vastaavasti, jos w=f(x,y,z), saadaan vaikkapa 
  	\frac{\partial^5 w}{\partial y\partial x\partial y^2\partial z} =
  	\frac{\partial }{\partial y}\frac{\partial }{\partial x}\frac{\partial }{\partial y}
  	\frac{\partial }{\partial y}\frac{\partial w}{\partial z}
  = f_{zyyxy}(x,y,z).

Esimerkki

Etsitään funktion f(x,y)=x^3y^4 toiset osittaisderivaatat. Saadaan aluksi 
  	f_{x}(x,y)=3x^2y^4\quad\text{ ja }\quad
  	f_{y}(x,y)=4x^3y^3.
  Siten \begin{align*} f_{xx}(x,y)&=\frac{\partial }{\partial x}3x^2y^4=6xy^4, \\ f_{yx}(x,y)&=\frac{\partial}{\partial x}4x^3y^3=12x^2y^3, \\ f_{xy}(x,y)&=\frac{\partial}{\partial y}3x^2y^4=12x^2y^3, \\ f_{yy}(x,y)&=\frac{\partial }{\partial y}4x^3y^3=12x^3y^2. \end{align*}

Huom. Edellisestä voidaan havaita, että f_{xy}(x,y)=f_{yx}(x,y). Tämä ei ole sattumaa!

Jos funktio f sekä sen osittaisderivaatat f_{xy} ja f_{yx} ovat kaikki jatkuvia, niin \frac{\partial^{2}f}{\partial x\partial y} = \frac{\partial^{2}f}{\partial y\partial x}. Toisin sanoen derivoimisjärjestyksellä ei ole tällöin väliä. Vastaava tulos pätee myös yleisesti kaikilla n\ge2.

2.2. Tangenttitaso ja normaalisuora

Pinnan tangentti ja normaali

Yhden muuttujan tapauksessa derivaatan avulla voidaan löytää lauseke derivoituvan funktion tangentille annetussa pisteessä. Normaali on kohtisuorassa tangenttia vastaan. Pinnalle z=f(x,y) saadaan puolestaan kaksi tangenttivektoria pisteessä (a,b,f(a,b)) käyrien t\mapsto(t,b,f(t,b)) ja t\mapsto(a,t,f(a,t)) tangentteina: 
  	\mathbf{T}_1 = \mathbf{i} + f_{x}(a,b)\mathbf{k} \quad\text{ ja }\quad
  	\mathbf{T}_2 = \mathbf{j} + f_{y}(a,b)\mathbf{k}.

Pinnan (ylä)normaalivektori \mathbf{N} = \mathbf{N}(a,b) on kohtisuorassa näitä molempia tangenttivektoreita vastaan. Siksi se saadaan ristitulona \begin{align*} \mathbf{N} &= \mathbf{T}_1\times \mathbf{T}_2 = \begin{vmatrix} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ 1 & 0 & f_{x}(a,b) \\ 0 & 1 & f_{y}(a,b) \end{vmatrix} =-f_{x}(a,b)\mathbf{i} - f_{y}(a,b)\mathbf{j} + \mathbf{k}. \end{align*} Pinnan yksikkönormaali \mathbf{n} saadaan normaalista \mathbf{N} skaalaamalla sen pituudella: 
\mathbf{n} = \frac{\mathbf{N}}{\| \mathbf{N}\|},
sillä yllä olevan kaavan perusteella \mathbf{N} ei voi olla nollavektori.

Tangenttitaso

Olkoon D\subset \mathbb{R}^2, f\colon D\to \mathbb{R} ja (a,b)\in D. Pinnan z=f(x,y) tangenttitaso pisteessä (a,b,f(a,b)) on aina kohtisuorassa normaalia \mathbf{N} = \mathbf{N}(a,b) vastaan ja se kulkee pisteen P=(a,b,f(a,b)) kautta. Merkitään pisteen P paikkavektoria \mathbf{r}_{0}. Tällaisen tason vektorit \mathbf{r} = (x,y,z) \in \mathbb{R}^3 toteuttavat yhtälön  
\mathbf{N} \cdot (\mathbf{r} - \mathbf{r}_{0}) = 0, 
sillä tason suuntaiset vektorin ovat kohtisuorassa normaalia vastaan. Tangenttitasolle saadaan siis yhtälö 
  -f_{x}(a,b)(x-a) - f_{y}(a,b)(y-b)+1\cdot (z-f(a,b))=0 \Leftrightarrow z=f(a,b) + f_{x}(a,b)(x-a) + f_{y}(a,b)(y-b).

Normaalisuoran yhtälöt

Normaalisuora pinnalle z=f(x,y) pisteessä P = (a,b,f(a,b)) on normaalivektorin \mathbf{N}(a,b) = -f_{x}(a,b)\mathbf{i} - f_{y}(a,b)\mathbf{j} + \mathbf{k} suuntainen.

Merkitään taas pisteen P paikkavektoria \mathbf{r}_{0}. Tällöin normaalisuoran pisteet ovat pistejoukko 
    \{ \mathbf{r}_{0} + t \mathbf{N}(a,b) \, : \, t \in \mathbb{R} \}.
  Jos sekä f_{x}(a,b) \neq 0 ja f_{y}(a,b) \neq 0, niin voidaan eliminoida parametri t ja saadaan yhtälöt 
  	\frac{x-a}{f_{x}(a,b)} = \frac{y-b}{f_{y}(a,b)} = \frac{z-f(a,b)}{-1}.

Esimerkki

Etsitään tangentti ja normaali pinnalle z=\sin(xy), kun x=\pi/3 ja y=-1. Tangentti ja normaali kulkevat pisteen (\pi/3,-1,-\sqrt{3}/2) kautta.

Lasketaan osittaisderivaatat: \frac{\partial z}{\partial x} = y\cos(xy)\text{ ja }
  	\frac{\partial z}{\partial y} = x\cos(xy). Pisteessä (\pi/3,-1) saadaan \frac{\partial z}{\partial x} = -\frac{1}{2} \text{ ja }
  	\frac{\partial z}{\partial y} = \frac{\pi}{6}. Siten kyseisellä pinnalla on normaalivektori 
  	\mathbf{N} = \frac{1}{2}\mathbf{i} - \frac{\pi}{6}\mathbf{j} + \mathbf{k}.
  Tangenttitaso on 
  	z= \frac{-\sqrt{3}}{2} - \frac{1}{2}\Big(x-\frac{\pi}{3}\Big) + \frac{\pi}{6}(y+1).
  Ja normaalisuoran yhtälöiksi saadaan 
  	\frac{6x-2\pi}{-3} = \frac{6y+6}{\pi} = \frac{6z+3\sqrt{3}}{-6}.

Kaltevuuskulma

Pinnan kaltevuuskulma \varphi mitataan vaakatasosta, mutta se on sama kuin pinnan ylänormaalin ja yksikkövektorin \mathbf{k} välinen kulma: piirrä poikkileikkauskuva! Näin ollen 
\cos\varphi =\frac{\mathbf{N}\cdot  \mathbf{k}}{\|\mathbf{N}\| \,\|\mathbf{k}\|} =
\frac{1}{\|\mathbf{N}\|}.

2.3. Gradientti ja suunnattu derivaatta

Gradientti

Olkoon f\colon D\subset \mathbb{R}^n\to\mathbb{R}, n\ge 2, derivoituva pisteessä \mathbf{x}\in D.

Määritelmä. Funktion f gradientti on vektori 
  \nabla f = \mathrm{grad}\, f = \Big(\frac{\partial f}{\partial x_1},\frac{\partial f}{\partial x_2},\ldots,\frac{\partial f}{\partial x_n}\Big)\in\mathbb{R}^n.
  Kaikki osittaisderivaatat lasketaan tutkittavassa pisteessä \mathbf{x}\in \mathbb{R}^n.

Gradientti on tavallisen derivaatan oikea vastine usean muuttujan funktioille, koska se ottaa huomioon kaikki osittaisderivaatat. Myöhemmin nähdään, että gradientti osoittaa siihen suuntaan, johon siirryttäessä funktio f kasvaa nopeimmin, vrt. esimerkiksi termi "lämpötilagradientti". Se on vektoriarvoinen funktio \nabla f\colon D \to \mathbb{R}^n. Tapauksessa n=3 voidaan kirjoittaa 
\nabla f= f_x \mathbf{i} + f_y \mathbf{j} + f_z \mathbf{k} \ \text{ ja }\
  \nabla = \mathbf{i} \frac{\partial}{\partial x} + \mathbf{j}\frac{\partial}{\partial y} + \mathbf{k}\frac{\partial}{\partial z}.
  Tapauksessa n=2 kolmas termi jää pois. Gradientti on Jacobin matriisin erikoistapaus m=1, vrt. alla.

Esimerkki

Olkoon f(x,y)=x^2+y^2. Tällöin saadaan \nabla f = 2x\mathbf{i} + 2y \mathbf{j}. Erityisesti \nabla f (a,b) on kohtisuorassa origokeskisen (yksikkö)ympyrän mielivaltaiseen pisteeseen (a,b) piirrettyä tangenttisuoraa vastaan. Tämä on erikoistapaus yleisemmästä tasa-arvokäyriä koskevasta ominaisuudesta.

Tasa-arvokäyrät

Olkoon c\in\mathbb{R} vakio, D\subset\mathbb{R}^2 ja f\colon D \to \mathbb{R} funktio. Tällöin joukko C= \{(x,y) : f(x,y)=c\} on usein tasokäyrä. Kyseinen pistejoukko voi olla myös tyhjä (jos f ei saa arvoa c) tai vaikkapa koko taso (jos f on vakio). Mikäli joukko C on tasokäyrä, sitä sanotaan funktion f arvoon c liittyväksi tasa-arvokäyräksi.

Esimerkiksi korkeuskäyrät kartalla ovat tasa-arvokäyriä funktiolle, joka liittää kartalla olevaan pisteeseen (x,y) sen korkeuden meren pinnasta.

Lause. Olkoon D\subset \mathbb{R}^2, (a,b)\in D ja f\colon D\to \mathbb{R} derivoituva pisteessä (a,b) ja \nabla f(a,b)\neq \mathbf{0}. Tällöin \nabla f(a,b) on kohtisuorassa pisteen (a,b) kautta kulkevaa funktion f tasa-arvokäyrää (t.s., sen tangenttia) vasten.

Seuraus: Jos piste \mathbf{x}\in D on funktion f paikallinen ääriarvo (minimi tai maksimi), niin \nabla f(\mathbf{x})=\mathbf{0}. Gradientin nollakohta ei kuitenkaan välttämättä ole funktion ääriarvo. Edes skalaarifunktion derivaatan nollakohta ei välttämättä ole minimi eikä maksimi, kuten nähdään jos f(x) = x^3.

Todistus. Olkoon I = [-1,1] ja \mathbf{r}(t)\colon I \to \mathbb{R}^2 tasa-arvokäyrän sellainen parametrisointi, että \mathbf{r}(0)=(a,b). Koska \mathbf{r}(t)=x(t)\mathbf{i} +y(t)\mathbf{j} on tasa-arvokäyrä, kaikilla t\in I pätee f(x(t),y(t))=f(a,b) eli vakio. Ketjusäännöstä saadaan (koska vakiofunktion derivaatta on nolla) 
  f_{x}\big(x(t),y(t)\big)x'(t) + f_{y}\big(x(t),y(t)\big)y'(t)=0.
  Erityisesti pisteessä t=0 tämä tarkoittaa, että 
  \nabla f(a,b)\cdot \mathbf{r}'(0)=0,
  eli toisin sanoen vektori \nabla f ja tangentin suuntainen \mathbf{r}'(0) ovat kohtisuorassa.

Suunnattu derivaatta

Edellinen tulos voidaan tulkita niin, että tasa-arvokäyrän tangentti antaa suunnan, johon edettäessä funktio ei kasva eikä vähene. Niinpä funktio kasvaa jyrkimmin gradienttinsa suuntaan, joka on tasa-arvokäyrän normaalivektori. Muihin suuntiin liikuttessa kasvunopeuden antaa suunnattu derivaatta 
     D_{\mathbf{u}}f(a,b) = \frac{dg}{dt}(0),
     \text{ jossa } g(t) = f(a + t u_1, b + t u_2)
  ja \mathbf{u} = u_1 \mathbf{i} + u_2 \mathbf{j} on yksikkösuuntavektori.

Lause. Olkoon f\colon D\subset \mathbb{R}^2\to \mathbb{R} funktio, (a,b)\in D ja \mathbf{u} =
  u_1 \mathbf{i} + u_2 \mathbf{j} sellainen vektori, että \|\mathbf{u}\|^2= u_1^2 +
  u_2^2 = 1. Tällöin funktion f suunnattu derivaatta suuntaan \mathbf{u} saadaan kaavasta 
  D_{\mathbf{u}}f(a,b) = \mathbf{u} \cdot \nabla f(a,b).

Esimerkki

Olkoon f(x,y)=y^4+2xy^3+x^2y^2. Etsitään D_{\mathbf{u}}f (0,1), kun \mathbf{u} on

a) \mathbf{i} +2\mathbf{j}~ b) \mathbf{j} - 2\mathbf{i}~ c) 3\mathbf{i}~ d) \mathbf{i}+\mathbf{j}.

Lasketaan \nabla f(x,y) = (2y^3+2xy^2)\mathbf{i} + (4y^3+6xy^2+2x^2y)\mathbf{j}, \nabla f(0,1) = 2\mathbf{i} + 4\mathbf{j}. a) \|\mathbf{i} +2\mathbf{j}\| = \sqrt{5} ja siten \mathbf{u} = (\mathbf{i} +2\mathbf{j})/\sqrt{5}. Saadaan 
  D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{5}}(\mathbf{i} +2\mathbf{j})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{2+8}{\sqrt{5}}=2\sqrt{5}.

Huomaa, että tässä \mathbf{u} ja \nabla f(0,1) ovat yhdensuuntaiset.

b) \|\mathbf{j} -2\mathbf{i}\| = \sqrt{5} ja siten \mathbf{u} = (\mathbf{j} -2\mathbf{i})/\sqrt{5}. Saadaan 
  D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{5}}(\mathbf{j} -2\mathbf{i})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{-4+4}{\sqrt{5}}=0.
  Vektorit \mathbf{u} ja \nabla f(0,1) ovat siis kohtisuorassa.

c) \|3\mathbf{i}\| = 3 ja siten \mathbf{u} = \mathbf{i}. Saadaan D_{\mathbf{u}}f(0,1)=\mathbf{i} \cdot (2\mathbf{i} + 4\mathbf{j}) = 2. Tämä on sama kuin f_1(0,1).

d) \|\mathbf{i} +\mathbf{j}\| = \sqrt{2} ja siten \mathbf{u} = (\mathbf{i} +\mathbf{j})/\sqrt{2}. Saadaan 
  D_{\mathbf{u}}f(0,1)=\frac{1}{\sqrt{2}}(\mathbf{i} +\mathbf{j})\cdot (2\mathbf{i} + 4\mathbf{j}) = \frac{2+4}{\sqrt{2}}=3\sqrt{2}.

Huomaa, että 3\sqrt{2}\approx 4.243 < 2\sqrt{5} \approx 4.472.

Määritelmä

Olkoon D\subset \mathbb{R}^n ja \mathbf{f} = (f_1,f_2,\ldots,f_m) vektori, missä jokainen funktion f komponentti on funktio f_j\colon D \to \mathbb{R} ja m,n\ge 2. Tällainen vektori määrittelee vektoriarvoisen funktion \mathbf{f}\colon \mathbb{R}^n \to \mathbb{R}^m, jota kutsutaan myös vektorikentäksi. Usein käytetään merkintää \mathbf{y} = \mathbf{f}(\mathbf{x}).

Vektoriarvoisia funktiota esiintyy usein mm. fysiikassa sellaisten suureiden yhteydessä, joilla on voimakkuus ja suunta (esimerkiksi nopeus- ja voimakentät).

Huomautus. Yllä f_j:t ovat tässä vektorin \mathbf{f} komponentteja (eivät siis osittaisderivaattoja).

Vektoriarvoisen funktion derivointi

Derivaatan luonnollinen vastine vektoriarvoisen funktion \mathbf{f} =(f_1,f_2,\ldots,f_m) tapauksessa on Jacobin matriisi 
  D\mathbf{f}(\mathbf{x}) =
  \begin{bmatrix}
  \frac{\partial f_1}{\partial x_1} &  \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n}\\
  \frac{\partial f_2}{\partial x_1} &  \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n}\\
  \vdots & \vdots & & \vdots \\
  \frac{\partial f_m}{\partial x_1} &  \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n}.
  \end{bmatrix}
  Jos m=n, Jacobin matriisi on neliömatriisi ja sen determinattia sanotaan funktion \mathbf{f} Jacobin determinantiksi pisteessä \mathbf{x}. Tätä determinanttia tarvitaan kurssin loppuosassa.

Jacobin matriiseilla ketjusääntö voidaan kirjoittaa yleisessä muodossa 
  D(\mathbf{f} \circ \mathbf{g})(\mathbf{x})= D\mathbf{f}\big(\mathbf{g}(\mathbf{x})\big)D\mathbf{g}(\mathbf{x}).

Sovellus: implisiittifunktiolause

Oletetaan, että skalaarifunktiot F_{(1)}, F_{(2)}, \ldots , F_{(n)} ovat derivoituvia. Tutkitaan yhtälöryhmää 
  \left\{\begin{array}{l}
  F_{(1)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\
  F_{(2)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\
  \vdots\\
  F_{(n)}(x_1,x_2,\ldots,x_m,y_1,y_2,\ldots,y_n)=0,\\
  \end{array}\right.
  pisteen P_0 = (a_1,a_2,\ldots,a_m,b_1,b_2,\ldots,b_n) lähellä. Muuttujat \mathbf{y}=(y_1,\ldots,y_n) voidaan esittää muuttujien \mathbf{x}=(x_1,\ldots,x_m) funktioina pisteen P_0 lähellä, jos funktion \mathbf{f}(\mathbf{y}) = (F_{(1)},\ldots,F_{(n)})(\mathbf{y}) Jacobin determinatti 
  \det D\mathbf{f}(\mathbf{y})\Big|_{P_0} \neq 0.

Esimerkki

Osoitetaan, että (u,v) voidaan esittää muuttujien (x,y,z) funktiona systeemistä 
  \left\{\begin{array}{l}
  F(x,y,z,u,v) = xy^2+xzu + yv^2-3 = 0,\\
  G(x,y,z,u,v) = x^3yz+2xv -u^2v^2-2 = 0,\\
  \end{array}\right.
  pisteen P_0=(1,1,1,1,1) lähellä.

Selvästi F(P_0) = G(P_0) = 0. Muodostetaan Jacobin determinatti 
  \left|\begin{array}{cc}
  \frac{\partial F}{\partial u} &
  \frac{\partial F}{\partial v} \\
  \frac{\partial G}{\partial u} &
  \frac{\partial G}{\partial v}
  \end{array}\right|\Big|_{P_0}
  =
  \left|\begin{array}{cc}
  xz & 2yv \\
  -2uv^2 & 2x-2u^2v
  \end{array}\right|\Big|_{P_0}
  =
  \left|\begin{array}{cc}
  1 & 2 \\
  -2 & 0
  \end{array}\right|=4.
  Koska determinantti ei ole nolla, voidaan kirjoittaa u = u(x,y,z)\quad \text{ ja }\quad v = v(x,y,z) kolmen muuttujan funktioina. Kaavoja näille funktioille ei kuitenkaan voida yleensä antaa.

2.4. Lineaarinen approksimaatio ja differentiaali

Approksimaatiot

Yksiulotteisessa tapauksessa muotoa y=f(x) olevan funktion kuvaajan tangenttisuora y=L(x) pisteessä a saadaan kaavasta 
  L(x) = f(a) + f'(a)(x-a).
  Tangenttisuoran lauseke antaa myös tavan approksimoida funktiota f pisteen a läheisyydessä: f(x)\approx L(x).

Miksi approksimaatiota tarvitaan, jos kerran tietokone voi laskea nopeasti ja tarkasti? Kun halutaan löytää "peukalosääntö" päässälaskun helpottamiseksi ja ymmärryksen lisäämiseksi. Kun funktio f on olemassa ainoastaan taulukoituna, esimerkiksi mittaustuloksista.

Lineaariset approksimaatiot usean muuttujan funktioille

Tapauksessa n=2 saadaan funktiota f(x,y) approksimoiva tangenttitaso z=L(x,y), joka voidaan muodostaa osittaisderivaattojen avulla kaavasta 
   f(x,y) \approx L(x,y) = f(a,b)+f_{x}(a,b)(x-a)+f_{y}(a,b)(y-b).
   Kolmen muuttujan tapauksessa saadaan samannäköinen approksimaatio 
   f(x,y,z) \approx L(x,y,z) = f(a,b,c)+f_{x}(a,b,c)(x-a)+f_{y}(a,b,c)(y-b)+f_z(a,b,c)(z-c).

Esimerkki

Etsitään lineaarinen approksimaatio funktiolle 
  	f(x,y)=\sqrt{2x^2+e^{2y}}
  pisteessä (2,0), ja arvioidaan funktion arvoa pisteessä (2.2,-0.2).

Saadaan f(2,0)=3. Funktion osittaisderivaatat ovat 
  	f_{x}(x,y) = \frac{2x}{\sqrt{2x^2+e^{2y}}}, \quad f_{x}(2,0)=\frac{4}{3}.
  ja 
  	f_{y}(x,y) = \frac{e^{2y}}{\sqrt{2x^2+e^{2y}}}, \quad f_{y}(2,0)=\frac{1}{3}.
  Siten 
  	L(x,y)=3 +\frac{4}{3}(x-2)+\frac{1}{3}(y-0).
  Haluttu approksimaatio siis on 
  	f(2.2,-0.2) \approx L(2.2,-0.2) = 3 +\frac{4}{3}(2.2-2)+\frac{1}{3}(-0.2-0)=3.2.
  Vertailun vuoksi funktion f(x,y) todellinen arvo pisteessä (2.2,-0.2) on noin 3.2172.

Differentiaali

Lineaarisen approksimaation lauseketta kutsutaan funktion differentiaaliksi (tai kokonaisdifferentiaaliksi) ja se voidaan kirjoittaa kahden muuttujan tapauksessa muodossa 
\Delta f = f(x+\Delta x,y+\Delta y) -f(x,y) = f_x\, \Delta x + f_y\, \Delta y +\text{virhetermi}.
 Differentiaalia merkitään  df = f_x\, \Delta x + f_y\, \Delta y =f_x \, dx + f_y\, dy. Tarkasti ottaen merkintään liittyy sekä tutkittava piste että siirtymävektori.

Lause. Jos funktiolla f on jatkuvat osittaisderivaatat, niin differentiaaliin liittyvä virhetermi voidaan esittää muodossa \|\Delta \mathbf{r}\| \varepsilon (\mathbf{r}, \Delta \mathbf{r}), jossa \varepsilon (\mathbf{r}, \Delta \mathbf{r}) \to 0, kun \|\Delta \mathbf{r}\| \to 0. Tässä siis \mathbf{r}= (x,y) ja \Delta \mathbf{r} =(\Delta x,\Delta y). Yleinen differentiaalikaava n-ulotteisessa tapauksessa on muotoa 
\Delta f = f(\mathbf{r} +\Delta \mathbf{r})- f(\mathbf{r}) = \nabla f (\mathbf{r})\cdot  \Delta \mathbf{r}
+ \|\Delta \mathbf{r}\| \varepsilon (\mathbf{r}, \Delta \mathbf{r}).
Makroskooppisen virheen arviointiin voidaan käyttää approksimaatiota 
|\Delta f|\lesssim |\nabla f (\mathbf{r})\cdot  \Delta \mathbf{r}|
               \le |f_x| |\Delta x|+|f_y| |\Delta y|+ |f_z| |\Delta z|,
jossa viimeinen muoto koskee tapausta n=3. Tässä merkintä \lesssim viittaa siihen, että epäyhtälö \le ei tarkasti ottaen ole voimassa, koska virhetermi on jätetty pois.

Huomautuksia

Toisin kuin yksiulotteisessa tapauksessa pelkkä osittaisderivaattojen olemassaolo ei riitä takaamaan edes funktion f(x,y) jatkuvuutta. Esimerkiksi funktiolle 
  	f(x,y)=\left\{\begin{array}{rl}
  	0, & \text{kun }x=0\text{ tai }y=0,\\
  	1, &\text{muuten}.
  	\end{array}\right.
  on f_y(0,0)=f_x(0,0)=0, mutta funktio on epäjatkuva pisteessä ( 0,0) . Toinen samanlainen esimerkki on funktio 
  	f(x,y)=\left\{\begin{array}{rl}
  	\frac{2xy}{x^2 +y^2}, & \text{kun }x^2+y^2>0,\\
  	0, &\text{kun } (x,y)=(0,0).
  	\end{array}\right.
  Siksi tilannetta on tarpeen analysoida tarkemmin. Halutaan ehto, joka kertoo milloin lineaarinen approksimaatio on mielekäs funktiolle f(x,y) lähellä pistettä (a,b).

Differentioituvuus

Määritelmä. Funktio f(x,y) on differentioituva pisteessä (a,b), jos 
  	\lim_{(h,k)\to (0,0)} \frac{f(a+h,b+k)-f(a,b)-h\,f_{x}(a,b)-k\,f_{y}(a,b)}{\sqrt{h^2+k^2}}=0.

Differentiaalikaavan avulla (virhetermi mukana!) voidaan todistaa seuraava tulos:

Lause. Jos f_{x},f_{y} ovat jatkuvia jossakin pisteen (a,b) ympäristössä, niin f on differentioituva pisteessä (a,b).

Esimerkki

Lasketaan virhetermi f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y), kun f(x,y)=x^3+xy^2.

Osittaisderivaatoiksi saadaan f_{x}(x,y)=3x^2+y^2 ja f_{y}(x,y)=2xy, joten \begin{align*} &f(x+h,y+k)-f(x,y)-h\,f_{x}(x,y)-k\,f_{y}(x,y) \\ &\quad =(x+h)^3+(x+h)(y+k)^2-x^3-xy^2-(3x^2+y^2)h -2xyk\\ &\quad=3xh^2+h^3+2yhk+hk^2+xk^2. \\ \end{align*} Lausekeen h- ja k-termit lähestyvät nollaa vähintään samalla nopeudella kuin h^2+k^2, kun (h,k)\to 0, joten differentioituvuuden määritelmä selvästi toteutuu.

2.5. Ketjusäännöt ja lineaarinen approksimointi

Motivaatio

Yleistetään derivoinnin ketjusääntö 
  \frac{d}{dx}f\big(g(x)\big) = f'\big(g(x)\big)g'(x)
  usean muuttujan funktioille f.

Ketjusääntö liittyy suoraan myös moniin käytännön sovelluksiin. Voidaan ajatella fysikaalista suuretta kuten lämpötilaa tai mekaanisen systeemin kokonaisenergiaa, jotka riippuvat useista eri toissijaisista muuttujista (kuten ajasta, paikasta tai nopeudesta). Nämä muuttujat voivat riippua edelleen kolmansista muuttujista (paikka ja nopeus esimerkiksi ajasta). Halutaan tarkastella kiinnostavan fysikaalisen suureen muutosnopeutta mainittujen kolmansien muuttujien suhteen.

Esimerkki

Retkeilijä liikkuu karttaa käyttäen mäkisessä maastossa. Olkoon (x,y) retkeilijän paikka kartalla, z=f(x,y) kulloinenkin korkeus meren pinnasta ja 
  \mathbf{r}(t)=\left(u(t),v(t)\right)
  retkeilijän paikka kartalla hetkellä t. Retkeilijän paikan korkeus eli etäisyys meren pinnan tasosta hetkellä t on siis yhdistetty funktio 
  z=f\left(u(t),v(t)\right) = g(t).
  Kuinka nopeasti retkelijän paikan korkeus muuttuu ajan kuluessa?

Ilmeisestikin vastaus kysymykseen on funktion g(t) derivaatta. Lasketaan: \begin{align*} \lim_{h\to 0}\frac{g(t+h)-g(t)}{h} &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t))}{h} \\ &= \lim_{h\to 0}\frac{f(u(t+h),v(t+h))-f(u(t),v(t+h))}{h}\\ &\quad + \lim_{h\to 0}\frac{f(u(t),v(t+h))-f(u(t),v(t))}{h} \end{align*} Yhden muuttujan ketjusäännön perusteella 
  	g'(t)=f_{x}\big(u(t),v(t)\big)u'(t)+f_{y}\big(u(t),v(t)\big)v'(t).

Ketjusäännöt

Olkoon z muuttujien x,y jatkuvasti derivoituva funktio (eli funktio, jolla on jatkuvat 1. kertaluvun osittaisderivaatat). Jos x,y ovat muuttujan t jatkuvasti derivoituvia funktioita, niin 
  	\frac{dz}{dt} = \frac{\partial z}{\partial x}\frac{dx}{dt}
  				+ \frac{\partial z}{\partial y}\frac{dy}{dt}.
  Jos x,y ovat kahden muuttujan s,t jatkuvasti derivoituvia funktioita, niin \begin{equation} \frac{\partial z}{\partial s} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial s} \end{equation} ja \begin{equation} \frac{\partial z}{\partial t} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial t}. \end{equation}

Ketjusäännöt voidaan todistaa soveltamalla tutkittavaan erotusosamäärään lineaarisen approksimaation kaavoja virhetermeineen.

Huom. Derivaatan ketjusääntö voidaan kirjoittaa myös gradientin avulla: Jos \mathbf{r}=(x(t),y(t)), niin \frac{d}{dt}f(\mathbf{r}(t)) = \frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt}=
  \nabla f(\mathbf{r}(t))\cdot \mathbf{r}'(t).

Keskeisiä kysymyksiä:
Mikä on yleinen idea näissä kaavoissa? Kuinka voidaan muodostaa yleisessä tapauksessa laskentakaava yhdistetyn funktion (osittais)derivaatoille?

Ajatellaanpa, että z = f(u,v,t), jossa u = u(x,y) ja v=v(y,t). Tarkastellaan graafina "infinitesimaalisen muutoksen etenemistä" muuttujasta t muuttujaan z kaikkien etenemisreittien kautta.

Kuinka tilanne muuttuu, jos lisäksi x = x(t) ja y= y(t), jolloin z = z(t) ja kysytään kaavaa derivaatalle \frac{d z}{d t}? Saadaan 
  	\frac{\partial z}{\partial t} =  \frac{\partial f}{\partial v}
    	\frac{\partial v}{\partial t}  + \frac{\partial f}{\partial t}
  ja \begin{align*} \frac{d z}{d t} & = \frac{\partial f}{\partial u} \left ( \frac{\partial u}{\partial x} \frac{d x}{d t} + \frac{\partial u}{\partial y} \frac{d y}{d t} \right ) \\ &\quad+ \frac{\partial f}{\partial v} \left ( \frac{\partial v }{\partial t} + \frac{\partial v}{\partial y} \frac{d y}{d t} \right ) + \frac{\partial f}{\partial t}, \end{align*} jossa on yhteensä viisi termiä.

Huomautus. Tässä on käytetty sekä notaatiota \frac{\partial z}{\partial t} että \frac{\partial f}{\partial t}, jotka tarkoittavat eri asiaa!

Esimerkki

Olkoon f\colon \mathbb{R}^2\to\mathbb{R} jatkuvasti derivoituva. Etsitään 
  	\frac{\partial}{\partial x} f(x^2y,x+2y)\text{ ja }
  	\frac{\partial}{\partial y} f(x^2y,x+2y).

Saadaan \begin{align*} \frac{\partial}{\partial x} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial x} (x^2y) \\ &\quad +f_{y}(x^2y,x+2y)\frac{\partial}{\partial x}(x+2y) \\ &= 2xy f_{x}(x^2y,x+2y)+ f_{y}(x^2y,x+2y). \end{align*} Vastaavasti voidaan laskea \begin{align*} \frac{\partial}{\partial y} f(x^2y,x+2y) &= f_{x}(x^2y,x+2y)\frac{\partial}{\partial y} (x^2y) \\ & +f_{y}(x^2y,x+2y)\frac{\partial}{\partial y}(x+2y) \\ &= x^2 f_{x}(x^2y,x+2y)+ 2f_{y}(x^2y,x+2y). \end{align*}

Esimerkki
Lämpötila ilmakehässä ({}^\circC) riippuu paikasta (x,y,z) sekä ajasta t. Ajatellaan lämpötilaa näistä parametrista riippuvana funktiona T(x,y,z,t). Jos funktio T esittää sääpalloon liitetyn lämpömittarin mittaamaa lämpötilaa, määritetään T:n muutos ajan suhteen.

Määritetään lämpötilan muutos hetkellä t=1, kun 
  	T(x,y,z,t)=\frac{xy}{1+z}(1+t),
  ja sääpallo etenee reittiä \mathbf{r}(t)=(t,2t,t-t^2). Koska lämpömittarin lukeman muutos riippuu kaikista neljästä parametrista, mitään niistä ei voida jättää huomiotta.

Lämpötilan muutoksen kaavaksi saadaan siten 
  	\frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt}
  	+\frac{\partial T}{\partial y}\frac{dy}{dt}
  	+\frac{\partial T}{\partial z}\frac{dz}{dt}
  	+\frac{\partial T}{\partial t}.
  Koordinaattifunktioiden arvot hetkellä t=1 ovat 
  	x=1,\quad y=2\text{ ja } z=0.
  Koordinaattifunktioiden derivaattojen arvot hetkellä t=1 ovat 
  	\frac{dx}{dt}=1,\quad \frac{dy}{dt}=2\text{ ja } \frac{dz}{dt}=-1.
  Siten hetkellä t=1 saadaan \begin{align*} \frac{\partial T}{\partial x} &= \frac{y}{1+z}(1+t)=4, &&\frac{\partial T}{\partial y} = \frac{x}{1+z}(1+t)=2, \\ \frac{\partial T}{\partial z} &= \frac{-xy}{(1+z)^2}(1+t)=-4, &&\frac{\partial T}{\partial t} = \frac{xy}{1+z}=2. \end{align*} Näin ollen, 
  \frac{dT}{dt}\bigg|_{t=1} = 4\cdot 1 + 2\cdot 2 + (-4) \cdot (-1) +2 = 14.

3. Taylorin polynomi ja sarja

Taylorin kaava

Yhden muuttujan tapauksessa m+1 kertaa jatkuvasti derivoituvaa funktiota f\colon I \to \mathbb{R} voidaan approksimoida kaavalla 
  f(x)\approx f(a)+f'(a)(x-a)+ \frac{f''(a)}{2!}(x-a)^2+ \ldots + \frac{f^{(m)}(a)}{m!}(x-a)^m.
  kun a,x\in I.

Tämä idea yleistyy usean muuttujan tapaukseen: Jos \mathbf{a}, \mathbf{h} \in
  \mathbb{R}^n, n\ge 2 ja funktiolla f\colon D\subset \mathbb{R}^n\to\mathbb{R} on jatkuvat kertaluvun (m+1) osittaisderivaatat pisteitä \mathbf{a},\mathbf{a}+\mathbf{h} yhdistävällä janalla, niin 
  f(\mathbf{a}+\mathbf{h}) \approx \sum_{j=0}^m\frac{(\mathbf{h} \cdot \nabla)^jf(\mathbf{a})}{j!}.

Perustelu. Yksinkertaisuuden vuoksi johdetaan tässä kaava tapauksessa n=2 riittävän sileille funktioille. Olkoon D\subset\mathbb{R}^{2} avoin ja funktio f\colon D\to\mathbb{R} äärettömän monta kertaa jatkuvasti derivoituva. Lisäksi oletetaan, että \mathbf{a}+t\mathbf{h}\subset D, kun 0\le t\le 1. Tällöin oleellisesti myös apufunktion F\colon\mathbb{R}\to\mathbb{R},F(t)=f(\mathbf{a}+t\mathbf{h}) kaikki derivaatat ovat jatkuvia suljetulla välillä \left[0,1\right].

Ketjusäännön nojalla saadaan apufunktiota derivoimalla F'(t) = h_{1}f_{x}(\mathbf{a}+t\mathbf{h}) + h_{2}f_{y}(\mathbf{a}+t\mathbf{h}) = (\mathbf{h}\cdot\nabla)f(\mathbf{a}+t\mathbf{h}) F''(t) = h_{1}h_{2}f_{xx}(\mathbf{a}+t\mathbf{h}) + h_{1}h_{2}f_{xy}(\mathbf{a}+t\mathbf{h}) + h_{2}h_{1}f_{xy}(\mathbf{a}+t\mathbf{h})
  + h_{2}h_{2}f_{yy}(\mathbf{a}+t\mathbf{h}) = (\mathbf{h}\cdot\nabla)^{2}f(\mathbf{a}+t\mathbf{h}) \vdots F^{(j)}(t) = (\mathbf{h}\cdot\nabla)^{j}f(\mathbf{a}+t\mathbf{h}). Tästä havaitaan, että F^{(j)}(0) = (\mathbf{h}\cdot\nabla)^{j}f(\mathbf{a}) ja siten yhden muuttujan funktion F Taylorin sarjakehitelmä on muotoa F(t) = F(0) + F'(0)t + \frac{1}{2}F''(0)t^{2}+\dots = \sum_{j=0}^{\infty}\frac{F^{(j)}(0)}{j!}t^{j}. Asettamalla tässä t=1 saadaan haluttu tulos, f(\mathbf{a}+t\mathbf{h}) = f(\mathbf{a})+\mathbf{h}\cdot\nabla f(\mathbf{a}) + \frac{1}{2}(\mathbf{h}\cdot\nabla)^{2}f(\mathbf{a})+\dots =\sum_{j=0}^{\infty}\frac{(\mathbf{h}\cdot\nabla)^{j}}{j!}f(\mathbf{a}).

Esimerkki

Olkoon (a,b)\in \mathbb{R}^2 ja f(x,y) neljä kertaa jatkuvasti derivoituva kiekossa (a,b)-keskisessä r-säteisessä kiekossa. Etsitään 3. asteen approksimaatio. Jos \mathbf{h} =(h,k), niin \begin{align*} f(a+h,b+k)&\approx f(a,b) + (hD_1+kD_2)f(a,b) +\frac{1}{2!}(hD_1+kD_2)^2f(a,b) \\ &\quad +\frac{1}{3!}(hD_1+kD_2)^3f(a,b) \\ &= f(a,b) + hf_{x}(a,b)+kf_{y}(a,b) \\ &\quad+ \frac{1}{2!}\Big(h^2f_{xx}(a,b)+2hkf_{xy}(a,b)+k^2f_{yy}(a,b)\Big) \\ &\quad+\frac{1}{3!}\Big(h^3f_{xxx}(a,b)+ 3h^2kf_{xxy}(a,b)+3hk^2f_{xyy}(a,b)+k^3f_{yyy}(a,b)\Big). \end{align*}

Huom. 1. asteen Taylor-approksimaatio on sama kuin tangenttitaso.

Esimerkki

Etsitään 2. asteen Taylor-approksimaatio funktiolle f(x,y)=\sqrt{x^2+y^3} pisteen (1,2) ympäristössä.

Lasketaan f(1,2)=3, 
  f_{x}(x,y)=\frac{x}{\sqrt{x^2+y^3}},\quad
  f_{y}(x,y)=\frac{3y^2}{2\sqrt{x^2+y^3}},
  eli f_{x}(1,2)=1/3 ja f_{y}(1,2)=2. Edelleen 
  f_{xx}(x,y)=\frac{y^3}{(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{xx}(1,2)= \frac{8}{27},
  
  f_{xy}(x,y)=\frac{-3xy^2}{2(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{xy}(1,2)= -\frac{2}{9},
  
  f_{yy}(x,y)=\frac{12x^2y+3y^4}{4(x^2+y^3)^{3/2}} \quad\Rightarrow\quad f_{yy}(1,2)= \frac{2}{3}.
  Siten \begin{align*} f(1+h,2+k) &\approx 3 + \frac{1}{3}h + 2k + \frac{1}{2!}\Big(\frac{8}{27}h^2+2\Big(-\frac{2}{9}\Big)hk+\frac{2}{3}k^2\Big) \\ &= \frac{4}{27}h^2-\frac{2}{9}hk+\frac{1}{3}k^2+\frac{1}{3}h + 2k + 3. \end{align*}

4. Ääriarvot

Kertausta: ääriarvot yhden muuttujan tapauksessa

Funktiolla f\colon I\subset \mathbb{R} \to \mathbb{R} on lokaali (paikallinen) maksimi pisteessä a\in I, jos f(x)\le f(a) kaikilla x:n arvoilla jossakin a:n ympäristössä (eli riittävän lähellä pistettä a). Vastaavasti lokaali minimi tarkoittaa sitä, että f(x)\ge f(a) jossakin a:n ympäristössä. Maksimi tai minimi on globaali, jos kyseinen epäyhtälö on voimassa kaikilla x\in I.
Ääriarvoja voi esiintyä:
  1. Funktion f kriittisissä pisteissä, joissa f'(x)=0,
  2. pisteissä joissa f:n derivaatta ei ole määritelty, ja
  3. määrittelyjoukon I reunalla.

Seuraavaksi yleistetään vastaavat ehdot funktion f\colon D\subset \mathbb{R}^n\to\mathbb{R} tapaukseen.

Ääriarvot ja usean muuttujan funktiot

Funktiolla f\colon D\subset \mathbb{R}^n\to\mathbb{R} on pisteessä \mathbf{x}_0\in D lokaali maksimi, jos jossakin pisteen \mathbf{x}_0 ympäristössä U\subset D pätee f(\mathbf{x})\le f(\mathbf{x}_0) kaikilla \mathbf{x}\in U. Vastaavasti f\colon D\subset \mathbb{R}^n\to\mathbb{R} on pisteessä \mathbf{x}_0\in D lokaali minimi, jos löytyy sellainen pisteen \mathbf{x}_0 ympäristö U\subset D, että f(\mathbf{x})\ge f(\mathbf{x}_0) kaikilla \mathbf{x}\in U. Ääriarvo on globaali eli absoluuttinen, jos kyseinen epäyhtälö on voimassa kaikilla \mathbf{x}\in D.
Ääriarvoja voi esiintyä:
  1. Funktion f kriittissä pisteissä eli gradientin nollakohdissa \nabla f(\mathbf{x})=0,
  2. pisteissä joissa \nabla f ei ole määritelty, sekä
  3. määrittelyjoukon D reunalla.
Joukon D kriittistä pistettä \mathbf{x}_0, joka ei ole maksimi tai minimi, kutsutaan funktion f\colon D\to \mathbb{R} satulapisteeksi.
Esimerkki
funktion kuvaaja

Funktiolla f(x,y)= 1-x^2-y^2 on globaali maksimi f(0,0)=1 pisteessä (0,0). Tämä piste on funktion f kriittinen piste, koska  \nabla f(0,0) = -2x\mathbf{i} -2y\mathbf{j} \Big|_{(0,0)}= \mathbf{0}.

Esimerkki
funktion kuvaaja
Funktiolla f(x,y)= y^2-x^2 on satulapiste (0,0). Tämä piste on funktion f kriittinen piste, koska  \nabla f(0,0) = -2x\mathbf{i}+2y\mathbf{j}\Big|_{(0,0)}= \mathbf{0}.
Esimerkki
funktion kuvaaja
Kaikki pisteet suoralla x=0 ovat funktion f(x,y)= -x^3 satulapisteitä. Huomaa, että  \nabla f(0,y) = -3x^2\mathbf{i} \Big|_{(0,y)}= \mathbf{0} \text{ kaikilla }y\in \mathbb{R}.
Esimerkki
funktion kuvaaja
Funktiolla f(x,y)= \sqrt{x^2+y^2} on lokaali minimi f(0,0)=0 pisteessä (0,0). Funktio f on jatkuva, mutta sen gradientti \nabla f ei ole määritelty tässä pisteessä.
Esimerkki
funktion kuvaaja
Funktiolla f(x,y)=1-x ei ole paikallisia ääriarvoja, jos sen määrittelyjoukko on koko taso D=\mathbb{R}^2. Jos määrittelyjoukoksi kuitenkin ajatellaan esimerkiksi kiekko D=\{(x,y): x^2+y^2 \leq 1\}, niin sen reunalla saadaan maksimi f(-1,0)=2 ja minimi f(1,0)=0.

4.1. Kriittisten pisteiden luokittelu

Johdanto

Ääriarvojen luokittelu perustuu suureen \Delta f= f(\mathbf{x} + \mathbf{h}) -f(\mathbf{x}) tarkasteluun kriittisessä pisteessä \mathbf{x}\in D. Jos \Delta f saa vain positiivisia arvoja (kun \|\mathbf{h}\| on pieni), on piste \mathbf{x} minimi ja negatiivisessa tapauksessa maksimi. Jos \Delta f vaihtaa merkkiä, niin piste \mathbf{x} ei ole minimi eikä maksimi. Tämä johtaa funktion f toisen derivaatan tarkasteluun kriittisessä pisteessä.
Yhden muuttujan tapauksessa:

  1. Jos f''(x)< 0, niin funktiolla f lokaali maksimi pisteessä x.
  2. Jos f''(x)>0, niin funktiolla f lokaali minimi pisteessä x.
  3. Jos f''(x)=0, niin testi ei anna vastausta, ja kysymys täytyy ratkaista muulla tavoin.
Seuraavaksi yritetään yleistää tätä ajatusta monen muuttujan funktiolle.

Hessen matriisi

Olkoon f\colon D\subset \mathbb{R}^n \to \mathbb{R} funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat. Funktion f luonnollinen derivaattakäsite on gradientti, joka itsessään on vektoriarvoinen funktio \nabla f\colon \mathbb{R}^n \to \mathbb{R}^n. Siten funktion f toinen derivaatta on matriisi, jota nimitetään Hessen matriisiksi  H_f(\mathbf{x})= \begin{bmatrix} \frac{\partial^2}{\partial x_1^2} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2\partial x_1} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n\partial x_1} f(\mathbf{x})\\ \frac{\partial^2}{\partial x_1\partial x_2} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2^2} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n\partial x_2} f(\mathbf{x})\\ \vdots & \vdots & & \vdots \\ \frac{\partial^2}{\partial x_1\partial x_n} f(\mathbf{x}) & \frac{\partial^2}{\partial x_2\partial x_n} f(\mathbf{x}) & \cdots & \frac{\partial^2}{\partial x_n^2} f(\mathbf{x}) \\ \end{bmatrix}. Koska f on kaksi kertaa jatkuvasti derivoituva, derivoinnin järjestystä voidaan vaihtaa, ja kyseinen matriisi on symmetrinen.

Miksi Hessen matriisi kiinnostaa meitä? Kun gradientin avulla voidaan kirjoittaa lineaarinen (ensimmäisen asteen) approksimaatio funktiolle f, niin Hessen matriisilla saadaan kvadraattinen tarkennus:  f(\mathbf{x} + \mathbf{h}) \approx f(\mathbf{x}) + \mathbf{h} \cdot \nabla f (\mathbf{x}) + \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T, jossa (vaaka)vektori \mathbf{h} = (h_1, h_2, \ldots , h_n) on pieni.

Tämä kaava on itse asiassa ainoastaan uusi tapa kirjoittaa toisen kertaluvun Taylorin approksimaatio n:n muuttujan funktiolle. Muotoa \mathbf{z} ^T A \mathbf{z} oleva lauseke on n\times n-neliömatriisille A niin kutsuttu neliömuoto, jossa \mathbf{z} on n-pystyvektori.

Kirjoita kaava auki tapauksessa n = 2!

Pisteessä, jossa \nabla f (\mathbf{x}) = 0, on voimassa approksimaatio f(\mathbf{x} + \mathbf{h}) - f(\mathbf{x}) \approx \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T. Tätä voidaan käyttää hyväksi mahdollisen ääriarvon luokittelussa pisteessä \mathbf{x} ajattelemalla, että \mathbf{h} \approx 0.

Matriisin (ja neliömuodon) definiittisyys

Symmetristä n\times n-matriisia A sanotaan positiividefiniitiksi, jos sen kaikki ominaisarvot ovat positiivisia ja negatiividefiniitiksi, jos -A on positiividefiniitti. Matriisin sanotaan olevan indefiniitti, jos sen kaikki ominaisarvot ovat nollasta poikkeavia ja sillä on vähintään yksi positiivinen sekä yksi negatiivinen ominaisarvo. Positiivi/negatiividefiniiteillä matriiseilla on monia samoja ominaisuuksia kuin positiivisilla/negatiivisilla reaaliluvuilla.

Symmetrisen matriisin A definiittiys tai indefiniittiys periytyy sitä vastaavalle neliömuodolle.
A on positiividefiniitti \Leftrightarrow \mathbf{x}^T A \mathbf{x}>0 kaikilla nollasta poikkeavilla pystyvektoreilla \mathbf{x}\in \mathbb{R}^n.
A on negatiividefiniitti \Leftrightarrow \mathbf{x}^T A \mathbf{x}< 0 kaikilla nollasta poikkeavilla pystyvektoreilla \mathbf{x}\in \mathbb{R}^n.
A on indefiniitti \Leftrightarrow \mathbf{x}^T A \mathbf{x} saavuttaa sekä negatiivisia että positiivisia arvoja pystyvektorin \mathbf{x} vaihdellessa.

Väite nähdään todeksi ortogonaalidiagonalisoimalla symmetrinen matriisi A muotoon A = U^T \Lambda U, jossa diagonaalimatriisi \Lambda sisältää A:n ominaisarvot.

Toisen derivaatan testi monen muuttajan tapauksessa

Lause. Olkoon f\colon D\subset \mathbb{R}^n\to\mathbb{R} funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat kriittisen pisteen \mathbf{x}\in D ympäristössä. Tällöin:
  1. Jos H_f(\mathbf{x}) on positiividefiniitti, niin f:llä on lokaali minimi pisteessä \mathbf{x}.
  2. Jos H_f(\mathbf{x}) on negatiividefiniitti, niin f:llä on lokaali maksimi pisteessä \mathbf{x}.
  3. Jos H_f(\mathbf{x}) on indefiniitti, niin \mathbf{x} on funktion f satulapiste.
  4. Muussa tapauksessa testi ei anna tietoa funktiosta f.

Lause seuraa approksimaatiosta f(\mathbf{x} + \mathbf{h}) - f(\mathbf{x}) \approx \frac{1}{2} \mathbf{h} H_f(\mathbf{x}) \mathbf{h}^T kun \mathbf{h} \approx 0. Väite täytyy nimittäin ainoastaan tarkastaa Hessen matriisin määräämälle neliömuodolle.

Esimerkki

Etsitään ja luokitellaan funktion  f(x,y,z) = x^2y+y^2z+z^2-2x kriittiset pisteet.

Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &= f_{x}(x,y,z)=2xy-2,\\ 0 &= f_{y}(x,y,z)=x^2+2yz,\\ 0 &= f_{z}(x,y,z)=y^2+2z.\\ \end{align*} Nämä yhtälöt ratkaisemalla nähdään, että funktion f ainoa kriittinen piste on P=(1,1,-1/2).

Lasketaan Hessen matriisi H_f(1,1,-1/2)=\left [ \begin{smallmatrix} 2 & 2 & 0 \\ 2 & -1 & 2 \\ 0 & 2 & 2 \end{smallmatrix} \right ] ja lasketaan matriisin ominaisarvot vaikkapa MATLABilla

   >> a = [2 2 0 ; 2 -1 2 ; 0 2 2]
   a =
       2     2     0
       2    -1     2
       0     2     2
   >> eig(a)
   ans =
      -2.7016
       2.0000
       3.7016

Koska ominaisarvoissa on erimerkkisiä lukuja, niin funktiolla f on satulapiste pisteessä P=(1,1,-1/2).

4.2. Maksimi ja minimi

Puuttuu vielä.

4.3. Lagrangen kertoimet

Lagrangen kertoimet

Usein optimointitehtävissä halutaan asettaa rajoitusehtoja optimoitaville muuttujille. Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty materiaali) A(h,r)=2\pi rh+2\pi r^2 niin, että tilavuus V(r,h)=\pi r^2 h on vakio.

Duaalitehtävä: Halutaan maksimoida purkin tilavuus V(r,h) siten, että pinta-ala A(h,r) on vakio. Primaali- ja duaalitehtävillä on sama ratkaisu. Tämän sanoo maalaisjärkikin, mutta itse asiassa ratkaisuun johtavat yhtälötkin ovat (olennaisesti) samoja.

Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä (a,b) vektorien \nabla f ja \nabla g on oltava joko yhdensuuntaisia tai vastakkaissuuntaisia (mikäli \nabla g(a,b) \neq 0). Miksi? Koska muussa tapauksessa funktiolla f olisi nollasta poikkeva suunnattu derivaatta käyrän g(x,y)=0 tangentin suuntaan pisteessä (a,b), ja siis minimi ei voi olla pisteessä (a,b).

Entä jos tehtävänä olisi maksimoida f(x,y) ehdolla g(x,y)=0? Entä jos tehtävänä olisi maksimoida g(x,y) ehdolla f(x,y)=c?

Mikäli optimipiste on olemassa, se on Lagrangen funktion 
  L(x,y,\lambda) = f(x,y) + \lambda g(x,y)
  kriittinen piste (eli gradientin nollakohta). Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen muuttujan tapauksessa Lagrangen funktio on 
  L(x,y,z,\lambda,\mu) = f(x,y,z) + \lambda g(x,y,z) + \mu  h(x,y,z),
  missä f on minimoitava funktio ja rajoite-ehdot ovat g(x,y,z)=0 sekä h(x,y,z)=0.

Esimerkki

Minimoidaan funktio f(x,y)=x^2+y^2 ehdolla g(x,y)=x^2y-16=0. Muodostetaan aluksi Lagrangen funktio 
  L(x,y,\lambda)=x^2+y^2+\lambda(x^2y-16).
  Yhtälöt kriittisille pisteille ovat \begin{align*} 0 &=\frac{\partial L}{\partial x} = 2x(1+\lambda y),\\ 0 &=\frac{\partial L}{\partial y} = 2y+\lambda x^2,\\ 0 &=\frac{\partial L}{\partial \lambda}= x^2y-16,\\ \end{align*} joista viimeinen on aina itse rajoitusehto.

Ensimmäisestä yhtälöstä saadaan x=0 tai \lambda y=-1, mutta x=0 on ristiriidassa kolmannen yhtälön kanssa. Siten toisesta yhtälöstä 
  0=2y^2+\lambda yx^2 = 2y^2-x^2.
  Tästä saadaan edelleen x=\pm \sqrt{2}y, ja 2y^3=16 eli y=2. Ääriarvoja (mahdollisia minimejä) on siis kaksi (x,y) =  (\pm 2\sqrt{2},2). Pitää selvittää muilla keinoin, ovatko nämä minimejä vai maksimeja.

Esimerkki

Yritetään etsiä Lagrangen kertoimien menetelmällä funktion f(x,y)=y minimi ehdolla g(x,y)=y^3-x^2=0. Helposti havaitaan, että minimi f(x,y)=0 saavutetaan pisteessä (0,0).

Muodostetaan Lagrangen funktio 
  L(x,y,\lambda)=y+\lambda(y^3-x^2).
  Saadaan yhtälöt 
  -2\lambda x =0,\quad 1+3\lambda y^2=0,\text{ ja } y^3-x^2=0.
  Nämä yhtälöt ovat keskenään ristiriidassa, joten ratkaisua niille ei ole. Huomaa, että \nabla g(0,0) =\mathbf{0} minimipisteessä. Tästä nähdään, että Lagrangen kertoimet näkevät ääriarvoja vain pisteissä, joissa \nabla g(0,0) \neq \mathbf{0}.

Esimerkki

Etsitään ääriarvot funktiolle f(x,y,z)=xy+2z ehdoilla x+y+z=0 ja x^2+y^2+z^2=24.

Koska f on jatkuva ja annettujen leikkausjoukkojen leikkaus on ympyräviiva (eli rajoitettu ja suljettu joukko), niin ääriarvot ovat olemassa. Muodostetaan Lagrangen funktio 
  L(x,y,z,\lambda,\mu)=xy+2z+\lambda(x+y+z)+\mu(x^2+y^2+z^2-24).
  Lagrangen funktion osittaisderivaatoista saadaan yhtälöt \begin{align*} & y+\lambda+2\mu x=0, \\ & x+\lambda+2\mu y=0, \\ & 2+\lambda+2\mu z=0, \\ & x+y+z = 0,\text{ ja } \\ & x^2+y^2+z^2-24=0. \end{align*} Kahden ensimmäisen yhtälön erotus johtaa yhtälöön (x-y)(1-2\mu)=0, joten joko \mu = 1/2 tai x=y. Tutkitaan molemmat tapaukset.

Tapaus I (\mu = 1/2): Toisen ja kolmannen yhtälön perusteella 
  x+\lambda +y =0\textrm{ ja } 2+\lambda +z =0,\text{ siis }x+y=2+z.
  Neljännestä yhtälöstä saadaan z=-1 ja x+y=1. Viimeisen yhtälön perusteella x^2+y^2=24-z^2=23. Koska x^2+y^2+2xy=(x+y)^2 =1, saadaan 2xy=1-23=-22 ja xy=-11. Nyt (x-y)^2 = x^2+y^2-2xy = 23+22=45, joten x-y=\pm 3\sqrt{5}. Yhdessä yhtälön x+y=1 kanssa tästä saadaan kaksi kriittistä pistettä 
  P_1 = \big((1+3\sqrt{5})/2,(1-3\sqrt{5})/2,-1\big)\text{ ja }
  P_2 = \big((1-3\sqrt{5})/2,(1+3\sqrt{5})/2,-1\big).
  Kummassakin pisteessä f(x,y,z)=-11-2 = -13.

Tapaus II (x=y): Neljännestä yhtälöstä nähdään, että z=-2x, ja viimeisen yhtälön perusteella 6x^2=24 eli x=\pm 2. Näin ollen, kriittiset pisteet ovat 
  P_3=(2,2,-4)\text{ ja } P_4=(-2,-2,4).
  Saadaan 
  f(2,2,-4)=4-8=-4\text{ ja } f(-2,-2,4)=4+8=12.
  Siten funktion f maksimi on 12 ja minimi -13.

5. PNS-menetelmä

Regressio-ongelma

Regressioanalyysissa pyritään valitsemaan parametrin \mathbf{\beta} arvo siten, että käyrä  y=f(x;\beta) kulkisi mahdollisimman läheltä jokaista havaintopistettä  (x_j,y_j)\in \mathbb{R}^2,\, j=1,2,\ldots ,n. Tällaista optimaalisesti valittua käyrää kutsutaan regressiomalliksi y=f(x;\beta), jossa funktion f muoto on valittu tilanteen ja harkinnan mukaan. Kunhan f on valittu, niin eräs ratkaisu käyränsovitusongelmaan on pienimmän neliösumman menetelmä.

Pienimmän neliösumman menetelmä

Pienimmän neliösumman menetelmässä pyritään minimoimaan regressiomallin virhetermien \varepsilon_j  \varepsilon_j = y_j - f(x_j;\beta ) \, , \quad j=1,2,\ldots ,n neliösummaa eli funktiota  F(\beta)= \sum_{j=1}^n\varepsilon_j^2 =\sum_{j=1}^n\big(y_j-f(x_j;\beta)\big)^2. muuttamalla parametrivektorin \mathbf{\beta}=(\beta_0,\beta_1,\ldots,\beta_m) arvoa. Optimaalinen \mathbf{\beta}:n arvo on parametrin \beta pienimmän neliösumman estimaatti eli PNS-estimaatti.

Kysymys: Miksi ei minimoitaisi lauseketta \sum_{j=1}^n|y_j-f(x_j;\beta)| neliösumman sijasta?

PNS-sovitus


Kuvassa vihreällä parametreista \mathbf{\beta} = (\beta_1, \beta_2, \ldots , \beta_m) riippuva sovitettava funktio f(x;\mathbf{\beta}) eräällä kiinteällä parametrin arvolla. Datapisteet (x_j,y_j) ja vastaavat virhetermit \varepsilon_j, kun j = 1, \ldots , n.

Lineaarinen regressio

Lineaarisessa regressiossa f(x;\beta) = \beta_0-\beta_1 x jossa \beta = (\beta_0, \beta_1) ja neliösumma on  F(\beta_0,\beta_1)=\sum_i (y_i -\beta_0-\beta_1 x_i)^2. Etsitään piste (\beta_0,\beta_1) siten, että \nabla F(\beta_0,\beta_1)=0.

Lasketaan osittaisderivaatta  \frac{\partial}{\partial \beta_0}F(\beta_0,\beta_1) = 2\big(\beta_1\sum_i x_i+n\beta_0-\sum_i y_i\big). Ratkaistaan nollakohta  \beta_0=\frac{1}{n}\sum_i y_i-\frac{\beta_1}{n} \sum_i x_i =\overline{\mathbf{y}} -\beta_1 \overline{\mathbf{x}} missä \overline{\mathbf{x}} on datavektorin \mathbf{x} = (x_1, x_2, \ldots , x_n) komponenttien aritmeettinen keskiarvo.

Lasketaan seuraavaksi osittaisderivaatta  \frac{\partial}{\partial \beta_1}F(\beta_0,\beta_1) = 2\big(\beta_0\underbrace{\sum_i x_i}_{=n\overline{x}}+\beta_1\sum_i x_i^2-\sum_i x_iy_i\big). Sijoittamalla \beta_0:n lauseke, saadaan  n\overline{\mathbf{x}} \overline{\mathbf{y}} - n \beta_1 \overline{\mathbf{x}} ^2+\beta_1 \sum_i x_i^2-\sum_i x_i y_i=0. Ratkaistaan nollakohta:  \beta_1=\frac{n\overline{\mathbf{x}} \overline{\mathbf{y}} -\sum_i x_iy_i}{n\overline{\mathbf{x}} ^2-\sum_i x_i^2} = \frac{\sum_i(x_i-\overline{\mathbf{x}})(y_i-\overline{\mathbf{y}})}{\sum_i(x_i-\overline{\mathbf{x}})^2}. Tarkista jälkimmäinen yhtälö!

Esimerkki

Sovita PNS-suora dataan

x_i0.01.02.03.04.0
y_i 2.10 1.92 1.84 1.71 1.64

ja estimoi (ekstrapoloi) y kun x=5.

Saadaan \overline{\mathbf{x}}=2.0, \overline{\mathbf{y}}= 1.842, ja  \beta_1 = \frac{-1.13}{10.0} = -0.113. Siten \beta_0=1.842 +0.113\cdot 2.0= 2.068. Näin ollen y=-0.113x + 2.068, ja kysytty estimaatti pisteessä x=5 on y=-0.113\cdot 5 + 2.068=1.503.

Esimerkki: Toisen asteen sovitus

Tutkitaan lisäaineen määrän x vaikutusta kuivumisaikaan y. Eri lisäaineen määrillä x_i (grammaa) saatiin kuivumisajat y_i (tuntia), i=1,\ldots,9:

x_i0.01.02.03.04.05.06.07.08.0
y_i 11.0 9.4 9.1 7.0 6.2 7.1 6.6 7.5 8.2

Huomataan, että kuivumisajan riippuvuus lisäaineen määrästä on epälineaarista.

Minimikohdan estimoimiseksi sovitetaan havaintoihin paraabeli y=\beta_0+\beta_1x+\beta_2x^2.

Pienimmän neliösumman yhtälöryhmä mallille on  \frac{\partial}{\partial \beta_k} \sum(y_i-\beta_0-\beta_1x_i-\beta_2x_i^2)^2 = 0, \qquad k=0,1,2. Näistä saadaan yhtälöryhmä  \left\{ \begin{array}{rcl} n\beta_0 + \beta_1\sum x_i +\beta_2 \sum x_i^2 &=& \sum y_i,\\ \beta_0\sum x_i+\beta_1 \sum x_i^2+\beta_2 \sum x_i^3 &=& \sum x_iy_i\\ \beta_0\sum x_i^2+\beta_1 \sum x_i^3+\beta_2 \sum x_i^4 &=& \sum x_i^2y_i. \end{array}\right. Laskemalla yhtälöryhmän kertoimet havainnoista saadaan  \left\{ \begin{array}{rcl} 9\beta_0 + 36\beta_1 + 204\beta_2 &=& 72.1\\ 36\beta_0 +204\beta_1 + 1296 \beta_2 &=& 266.6 \\ 204 \beta_0 +1296\beta_1 + 8772\beta_2 &=& 1515.4 \end{array}\right.

Ratkaisuna ovat  \beta_0=11.15, \beta_1=-1.806 ja  \beta_2=0.1803. Pienimmän neliösumman mielessä parhaiten havaintoihin liittyvä paraabeli on siten  y=11.15 - 1.806x + 0.1803 x^2.

6. Newtonin menetelmä

Newtonin iterointi

Newtonin menetelmällä voidaan löytää (vähintäänkin derivoituvan) funktion f\colon \mathbb{R} \to \mathbb{R} nollakohta eli yhtälön f(x)=0 ratkaisu. Silloin kun menetelmä toimii, se suppenee hyvin nopeasti. Silloin kun ei, niin...

Lähdetään liikkeelle jostakin pisteestä x_0, joka on alkuarvaus yhtälön ratkaisulle. Arvioidaan funktiota f sen tangenttisuoralla pisteessä, eli funktiolla l(x)=f(x_0)+f'(x_0)(x-x_0). Ratkaistaan yhtälö l(x_1)=0. Toistetaan edellinen käyttäen alkuarvauksena lukua x_1 luvun x_0 sijasta jne. Tämä menettely johtaa algoritmiin, jossa iteraatioaskeleet saadaan kaavasta 
x_{n+1}= x_n-\frac{f(x_n)}{f'(x_n)}\,\qquad n=0,1,2,\ldots.
Suppeneminen ja löytyvä nollakohta riippuvat alkuarvauksesta x_0.

Esimerkki

Etsitään likiarvo luvulle \sqrt{5}.
Koska 2=\sqrt{4}, niin valitaan x_0=2 läheltä ratkaisua. Tässä f(x)=x^2-5, joten f'(x)=2x. Saadaan 
x_1 = x_0 - \frac{f(2)}{f'(2)} = 2- \frac{4-5}{2\cdot 2}= \frac{9}{4}.

x_2 = x_1 - \frac{f(9/4)}{f'(9/4)} = \frac{9}{4} - \frac{27/16-5}{2\cdot 9/4} = \frac{161}{72}
\approx 2.2361.

Huomaa, että \sqrt{5}\approx 2.236068, eli jo kahdella iteraatiolla saatiin varsin hyvä likiarvo.

Esimerkki

Etsitään funktion f(x)=x^3-x+1 nollakohdat.

Piirtämällä kuvaaja nähdään, että funktiolla on vain yksi nollakohta jossain pisteiden -2 ja -1 välissä. Asetetaan x_0=-1.

Koska f'(x)=3x^2-1 iteratioksi saadaan 
x_{n+1} = x_n - \frac{x_n^3-x_n+1}{3x_n^2-1}.
Saadaan 
x_0=-1,\quad x_1= -1.5, \quad x_2 = -1.347826, \quad x_3=-1.325200.

x_4= -1.324718, \quad x_5=-1.324717, \quad \ldots

Newtonin menetelmä monen muuttujan tapauksessa

Newtonin menetelmä toimii myös funktion \mathbf{f} \colon \mathbb{R}^n\to\mathbb{R}^n tapauksessa. Tällöin iteraatiokaavassa oleva derivaatta pitää korvata Jacobin matriisilla 
D\mathbf{f}(\mathbf{x}) =
\begin{bmatrix}
  \frac{\partial f_1}{\partial x_1} &  \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n}\\
  \frac{\partial f_2}{\partial x_1} &  \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n}\\
  \vdots & \vdots & & \vdots \\
  \frac{\partial f_m}{\partial x_1} &  \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n}
\end{bmatrix}.
Iteraatioaskeleeksi saadaan 
\mathbf{x}_{n+1} = \mathbf{x}_n- D\mathbf{f} (\mathbf{x}_n)^{-1}\mathbf{f}(\mathbf{x}_n), \quad n=0,1,2,\ldots,
missä D\mathbf{f} (\mathbf{x}_n)^{-1} on D\mathbf{f} (\mathbf{x}_n):n käänteismatriisi.

Esimerkki

Etsitään \mathbf{f}(\mathbf{x})=\mathbf{0}, kun \mathbf{x}_0=(1,0,1) ja 
\mathbf{f}(x,y,z)=(x^2+y^2+z^2-3)\mathbf{i} + (x^2+y^2-z-1)\mathbf{j} +(x+y+z-3)\mathbf{k}.
Saadaan 
D \mathbf{f} (x,y,z)=\begin{bmatrix}2x &2y & 2z\\ 2x&2y&-1\\ 1&1&1\end{bmatrix}
ja voidaan laskea 
\mathbf{x}_1 = (3/2,1/2,1),\quad \mathbf{x}_2 = (5/4,3/4,1)\quad \text{ ja }\quad \mathbf{x}_2 = (9/8,7/8,1),
mikä on terveellisintä tehdä tietokoneella.

Nähdään, että iteraatiot konvergoivat kohti pistettä (1,1,1), joka on tehtävän tarkka (ja kaikesta päätellen ainoa) ratkaisu.

7. Taso- ja avaruusintegraalit

Tässä luvussa tutustutaan taso- ja avaruusintegraaleihin ja niiden sovelluksiin.

7.1. Tasointegraali

Tasointegraali

Olkoon D\subset \mathbb{R}^2 joukko tasossa ja f\colon D\to \mathbb{R} skalaarikenttä. Halutaan määritellä tasointegraali  \iint_D f(x,y)\,dA. Integraalin arvo on pinnan z=f(x,y) ja xy-tason väliin jäävän alueen tilavuus.

Tutkitaan aluksi erikoistapausta D=[a,b]\times [c,d].

Yhden muuttujan tapaus

Yhden muuttujan tapauksessa integraali saadaan Riemannin summien raja-arvona.

Riemannin summa

Formaalisti  \int_a^b f(x)\,dx = \lim_{n\to\infty} \sum_{i=1}^n f(x_i)\Delta x, missä a=x_0 < x_1 < \ldots < x_n=b on välin [a,b] tasavälinen jako ja \Delta x on jakovälin pituus.

Usean muuttujan tapaus (tasointegraali, \mathbb{R}^2)

Jaetaan tason osajoukko D=[a,b]\times [c,d] tasavälisesti ruudukoksi niin, että kummallakin akselilla on n jakopistettä.

taso-joukon jako

Nyt voidaan määritellä  \iint_D f(x,y)\,dA = \lim_{n\to\infty} \sum_{i=1}^n\sum_{j=1}^n f(x_i,y_j)\,\Delta x\Delta y, missä x_{i} = a + i\frac{b-a}{n},\qquad y_{j} = c + j\frac{d-c}{n} ja \Delta x sekä \Delta y vastaavat jakovälien pituutta x ja y-suunnassa:  \Delta x= \frac{b-a}{n},\quad \Delta y = \frac{d-c}{n}.

Huomautuksia

Yhden muuttujan tapauksessa integraaleille pätee Analyysin (ensimmäinen) peruslause:  f(x)=\frac{d}{dx}\int_c^x f(t)\,dt,\textrm{ kun }c,x\in[a,b] ja f\colon [a,b]\to\mathbb{R} on jatkuva funktio.

Analyysin peruslauseesta seuraa, että integrointi ja derivointi ovat toistensa vastaoperaatiota, mikä johtaa moniin integroinnissa hyödyllisiin kaavoihin. Analyysin peruslauseella ei kuitenkaan ole aivan samanlaista vastinetta usean muuttujan tapauksessa; Greenin, Gaussin ja Stokesin lauseet ovat kuitenkin sille sukua.

Moninkertainen integraali

Monen muuttujan integraaleja voidaan usein kuitenkin laskea moninkertaisina integraaleina. Kaksiulotteinen tapaus (integrointialue suorakulmio)  \iint_D f(x,y)\,dA = \int_c^d \int_a^b f(x,y)\,dx\,dy, \text{ kun } D=[a,b]\times [c,d].

Mikäli funktio f\colon \mathbb{R}^2 \to \mathbb{R} on jatkuva, niin integroimisjärjestyksellä ei ole väliä integraalin arvon kannalta. Laskujen helppouden kannalta väliä kuitenkin on.

Esimerkki

Olkoon f(x,y)=xy^2. Lasketaan  \iint_D f(x,y)\,dA,\text{ kun } D=\{(x,y)\in \mathbb{R}^2: 0\le x\le1, \,0\le y\le 1\}.
Aluksi kirjoitetaan tasointegraali kaksinkertaisena integraalina, ja lasketaan \begin{align*} \iint_D xy^2\,dA &= \int_0^1\int_0^1 xy^2\,dx\,dy = \int_0^1\bigg[\frac{x^2y^2}{2}\bigg]_{x=0}^{1}\,dy \\ &= \int_0^1 \frac{y^2}{2}\,dy \bigg[\frac{y^3}{6}\bigg]_{y=0}^1 = \frac{1}{6}. \end{align*}

Integrointi yleisemmissä alueissa

Tutkitaan funktiota f\colon D\to \mathbb{R}, joka on määritelty tason osajoukossa D. Tähän asti on oletettu, että D on suorakulmio. Yleisemmässä tapauksessa voidaan tarkastella suorakulmiota \hat D, jolle D\subset \hat D. Jotta integraali olisi määritelty, täytyy joukon D olla ''siisti'' (riittää esimerkiksi, että reuna on paloittain sileä).

yleinen alue D

Määritellään funktio \hat f\colon \hat D \to \mathbb{R} seuraavasti:  \hat f(x,y) = \left\{ \begin{array}{rcl} f(x,y), &\text{kun} &(x,y) \in D,\\ 0, & \text{kun} & (x,y) \in \hat D \setminus D. \end{array}\right. Nyt voidaan määritellä  \iint_D f(x,y)\,dA := \iint_{\hat D} \hat f(x,y)\,dA. Samaan tapaan voidaan määritellä myös avaruusintegraali ei-suorakulmaisen integroimisalueen tapauksessa:  \iiint_D f(x,y,z)\,dV := \iiint_{\hat D} \hat f(x,y,z)\,dV, kun \hat D on suorakulmainen särmiö ja D \subset \hat D.

Esimerkki

Olkoon  D=\{(x,y)\in \mathbb{R}^2 : 0 < x < 1,\, 0 < y < x\} . Lasketaan funktion f(x,y)=xy integraali yli alueen D.

\begin{align*} &\iint_D xy\,dA = \int_0^1\bigg(\int_0^x xy\,dy\bigg)dx \\ &\quad \int_0^1\frac{xy^2}{2}\bigg|_{y=0}^x\,dx = \int_0^1\frac{x^3}{2}\,dx = \frac{x^4}{8}\bigg|_{x=0}^1 =\frac{1}{8}. \end{align*} Integrointi on mahdollista suorittaa myös toisessa järjestyksessä: \begin{align*} &\iint_D xy\,dA = \int_0^1\bigg(\int_y^1 xy\,dx\bigg)dy \\ &\quad = \int_0^1\frac{x^2y}{2}\bigg|_{x=y}^1\,dy = \int_0^1\frac{y}{2}-\frac{y^3}{2}\,dy \\ &\quad = \bigg[\frac{y^2}{4}-\frac{y^4}{8}\bigg]_{y=0}^1 = \frac{1}{4}-\frac{1}{8} = \frac{1}{8}. \\ \end{align*}

Esimerkki

Lasketaan funktion f(x,y)=e^{x^2} integraali edellisen esimerkin alueessa.

 \iint_D e^{x^2}\,dA = \int_0^1\bigg(\int_0^x e^{x^2}\,dy\bigg)dx =\int_0^1 xe^{x^2}\,dx Sijoituksella t=x^2, dt=2x\,dx saadaan  \frac{1}{2}\int_0^1e^t\,dt = \frac{1}{2}e^t\bigg|_{t=0}^1 = \frac{e}{2}-\frac{1}{2}.

Huomautus. Integroimisjärjestyksellä on väliä. Integraali  \int_0^1\bigg(\int_y^1e^{x^2}\,dx\bigg)dy on "hyvin vaikea" laskea.

7.2. Avaruusintegraali

Usean muuttujan tapaus (avaruusintegraali, \mathbb{R}^3)

Tasointegraalia mukaillen voidaan samaan tapaan määritellä avaruusintegraali:  \iiint_D f(x,y,y)\,dV = \lim_{n\to\infty} \sum_{i=1}^n\sum_{j=1}^n\sum_{k=1}^n f(x_i,y_j,z_k)\,\Delta x\Delta y\Delta z, kun D=[a_1,b_1]\times [a_2,b_2]\times[a_3,b_3] \subset \mathbb{R}^2 ja f\colon D\to \mathbb{R}. Tässä  \Delta x = \frac{b_1-a_1}{n},\quad \Delta y = \frac{b_2-a_2}{n}\text{ ja } \Delta z = \frac{b_3-a_3}{n}. Vieläkin useamman muuttujan funktioita f\colon D\subset \mathbb{R}^n\to\mathbb{R}, missä n\ge 2, voi integroida samaan tapaan.

Huomautuksia

Yhden muuttujan tapauksessa integraaleille pätee Analyysin (ensimmäinen) peruslause:  f(x)=\frac{d}{dx}\int_c^x f(t)\,dt,\textrm{ kun }c,x\in[a,b] ja f\colon [a,b]\to\mathbb{R} on jatkuva funktio.

Analyysin peruslauseesta seuraa, että integrointi ja derivointi ovat toistensa vastaoperaatiota, mikä johtaa moniin integroinnissa hyödyllisiin kaavoihin. Analyysin peruslauseella ei kuitenkaan ole aivan samanlaista vastinetta usean muuttujan tapauksessa; Greenin, Gaussin ja Stokesin lauseet ovat kuitenkin sille sukua.

Moninkertainen integraali

Monen muuttujan integraaleja voidaan usein kuitenkin laskea moninkertaisina integraaleina. Kolmiulotteinen tapaus (integrointialue suorakulmainen särmiö)  \iiint_D f(x,y,z)\,dV = \int_{a_3}^{b_3}\int_{a_2}^{b_2}\int_{a_1}^{b_1} f(x,y,z)\,dx\,dy\,dz, kun D=[a_1,b_1]\times [a_2,b_2]\times [a_3,b_3].

Mikäli funktio f\colon \mathbb{R}^3 \to \mathbb{R} on jatkuva, niin integroimisjärjestyksellä ei ole väliä integraalin arvon kannalta. Laskujen helppouden kannalta väliä kuitenkin on.

Esimerkki
Olkoon f(x,y,z)=xye^z. Lasketaan  \iiint_D f(x,y,z)\,dV,\text{ missä } D=[0,2]\times [0,1] \times [-1,1].
Kirjoitetaan avaruusintegraali kolminkertaisena integraalina. Lasketaan \begin{align*} &\iiint_D xye^z\,dV = \int_{-1}^1\int_0^1\int_0^2 xye^z\,dx\,dy\,dz \\ &\quad = \int_{-1}^1\int_0^1 \frac{x^2ye^z}{2}\bigg|_{x=0}^2\,dy\,dz = \int_{-1}^1\int_0^1 2ye^z\,dy\,dz \\ &\quad = \int_{-1}^1 y^2e^z\bigg|_{y=0}^1\,dz = \int_{-1}^1 e^z\,dz = e^z\Big|_{z=-1}^1 = e -e^{-1}. \end{align*}

Integrointi yleisemmissä alueissa

Tutkitaan funktiota f\colon D\to \mathbb{R}, joka on määritelty avaruuden osajoukossa D. Tähän asti on oletettu, että D on suorakulmainen särmiö. Yleisemmässä tapauksessa voidaan tarkastella suorakulmaista särmiötä \hat D, jolle D\subset \hat D. Jotta integraali olisi määritelty, täytyy joukon D olla ''siisti'' (riittää esimerkiksi, että reuna on paloittain sileä).

Määritellään funktio \hat f\colon \hat D \to \mathbb{R} seuraavasti:  \hat f(x,y) = \left\{ \begin{array}{rcl} f(x,y), &\text{kun} &(x,y) \in D,\\ 0, & \text{kun} & (x,y) \in \hat D \setminus D. \end{array}\right. Nyt voidaan määritellä avaruusintegraali ei-suorakulmaisen integroimisalueen tapauksessa:  \iiint_D f(x,y,z)\,dV := \iiint_{\hat D} \hat f(x,y,z)\,dV, kun \hat D on suorakulmainen särmiö ja D \subset \hat D.

7.3. Taso- ja avaruusintegraalien sovelluksia

Moninkertaisten integraalien sovelluksia

Tähän mennessä moninkertaisten integraalien sovelluksina on esiintynyt:

  • Alueen D \subset \mathbb{R}^2 pinta-ala 
\textrm{A}(D) = \iint_D 1\,dA

  • Kappaleen D \subset \mathbb{R}^3 tilavuus 
\textrm{V}(D) = \iiint_D 1\,dV

Mekaniikassa tulevat lisäksi vastaan nämä:

  • Kappaleen massa 
m(D) = \iiint_D \rho(x,y,z)\,dV
ja hitausmomentti kappaleen pyöriessä z-akselin ympäri: 
I_z(D) = \iiint_D\rho(x,y,z)(x^2+y^2)\,dV.
Tässä \rho(x,y,z) on materiaalin tiheys pisteessä (x,y,z).

  • Kaksiulotteisen tasolevyn keskiön (painopiste) (\bar x,\bar y) laskeminen 
\bar x = \frac{1}{A(D)} \iint_D x\,dA, \qquad
\bar y = \frac{1}{A(D)} \iint_D y\,dA,
jossa pinta-ala A(D) on laskettu tasointegraalilla jo aiemmin.

    Jos levyn massa ei ole tasaisesti jakautunut, integraalia korjataan paikasta riippuvalla tiheydellä \rho(x,y) 
\bar x = \frac{1}{m(D)} \iint_D x \rho(x,y) \,dA, \qquad
\bar y = \frac{1}{m(D)} \iint_D y \rho(x,y) \,dA.
jossa massa m(D) = \iint_D \rho(x,y) \,dA lasketaan tasointegraalilla.

Massakeskipiste

Kolmiulotteisen kappaleen D massakeskipiste (\bar x,\bar y, \bar z) 
\bar x = \frac{1}{m(D)} \iiint_D x \rho(x,y,z)\,dV,

\bar y = \frac{1}{m(D)} \iiint_D y \rho(x,y,z)\,dV,

\bar z = \frac{1}{m(D)} \iiint_D z \rho(x,y,z)\,dV,
missä \rho = \rho(x,y,z) on kappaleen tiheys pisteessä (x,y,z) ja m(D) on kappaleen massa (tilavuusintegraalilla). Kaava voidaan kirjoittaa myös vektorimuodossa 
 \bar x\mathbf{i} + \bar y \mathbf{j} + \bar z\mathbf{k} = \frac{\iiint_D \mathbf{r} \rho\, dV}{\iiint_D\rho \,dV},
missä \mathbf{r} = x\mathbf{i} + y\mathbf{j} + z\mathbf{k}.

Esimerkki

Lasketaan epäyhtälöiden 0\le x\le 1, 0\le y\le 1 ja 0\le z\le 1 määräämän yksikkökuution D massakeskipiste, kun tiheys \rho(x,y,z)= z.

Huomautus. Yksikkökuutio D voidaan myös määritellä käyttäen niin kutsuttua karteesista tuloa: 
D = [0,1] \times [0,1] \times [0,1] = [0,1]^3.
Tämä merkintätapa tarkoittaa samaa kuin ylläoleva määritelmä epäyhtälöiden avulla.

Lasketaan ensin massa 
\iiint_D \rho \,dV = \int_0^1 \int_0^1 \int_0^1 z \,dx\,dy\,dz

= \int_0^1 z\,dz = \bigg|_{z=0}^1\frac{1}{2}z^2 = \frac{1}{2}.
Saadaan 
\bar x = \frac{\int_0^1 \int_0^1 \int_0^1 xz \,dx\,dy\,dz}{1/2}
= \frac{\Big(\Big|_{x=0}^1 \frac{1}{2}x^2\Big)\Big(\Big|_{z=0}^1 \frac{1}{2}z^2\Big)}{1/2}

= \frac{(1/2)^2}{1/2} = \frac{1}{2}.

Vastaavasti 
\bar y = \frac{\int_0^1 \int_0^1 \int_0^1 yz \,dx\,dy\,dz}{1/2}
= \frac{(1/2)^2}{1/2} = \frac{1}{2}.
Edelleen voidaan laskea 
\bar z = \frac{\int_0^1 \int_0^1 \int_0^1 z^2 \,dx\,dy\,dz}{1/2}
= \frac{\Big|_{z=0}^1 \frac{1}{3}z^3}{1/2}

=  \frac{(1/3)}{(1/2)} = \frac{2}{3}.
Massakeskipisteeksi saadaan 
(\bar x, \bar y,\bar z) = (1/2,1/2,2/3).

Hitausmomentti

Tarkastellaan tilannetta, jossa pistemäiset kappaleet kiertävät origoa xy-tasossa ympyrän muotoista rataa pitkin samalla kulmanopeudella.

Kappaleiden yhteenlaskettu liike-energia saadaan laskemalla summa 
 E= \sum_{i=1}^N \frac{1}{2} m_iv_i^2= \frac{1}{2} \Big[\sum_{i=1}^N m_i r_i^2\Big]\omega^2= \frac{1}{2}\Big[\sum_{i=1}^N m_i(x_i^2+y_i^2)\Big]\omega^2,
missä \omega on kulmanopeus ja m_i, x_i sekä y_i ovat i:nnen kappaleen massa ja paikka. Summaa 
\sum_{i=1}^N m_i(x_i^2+y_i^2) = \sum_{i=1}^N m_i r_i^2
kutsutaan hitausmomentiksi. Ajattelemalla z-akselin ympäri pyörivä kappale joukoksi "infinitesimaalisen pieniä" pisteitä, voidaan edelläolevasta summasta päätellä kappaleen liike-energia: 
E=\frac{1}{2} \bigg[ \iiint_D (x^2+y^2)\rho(x,y,z)\,dV\bigg]\omega^2
=\frac{1}{2} I_z\omega^2,
missä 
I_z = \iiint_D(x^2+y^2)\rho(x,y,z)\,dV = \iiint_D r_z^2 dm
on kappaleen hitausmomentti z-akselin suhteen (r_z^2 = x^2 + y^2 ja massa-alkio dm = \rho(x,y,z)\,dV).

Esimerkki

Lasketaan sylinterin 
D= \{(x,y,z): x^2+y^2\le a^2\textrm{ ja }0\le z\le 1\},\qquad a>0
hitausmomentti z-akselin suhteen, kun tiheys on vakio \rho=\rho_0.

Lasketaan 
I_z = \iiint_D (x^2+y^2)\rho_0\,dV

= \rho_0 \int_0^1 \int_0^{2\pi}\int_0^a r^2r \,dr\,d\theta\,dz

= 2\pi\rho_0\int_0^ar^3\,dr = \frac{1}{2}\pi\rho_0a^4.
Toisaalta sylinterin massa on 
m=\iiint_D \rho_0\,dV = \rho_0\textrm{V}(D)=\rho_0\pi a^2.
Siten hitausmomentti voidaan kirjoittaa 
I_z = \frac{1}{2}(\pi \rho_0a^2)a^2 = \frac{1}{2}ma^2.

7.4. Yleinen muuttujanvaihto

Muuttujanvaihto tasointegraaleissa

Tutkitaan funktiota \mathbf{F}\colon G \to D, missä D ja G ovat \mathbb{R}^2:n osajoukkoja. Oletetaan, että funktion \mathbf{F} kaikki osittaisderivaatat ovat olemassa ja jatkuvia. Lisäksi oletetaan, että \mathbf{F} on bijektio: Jokaista pistettä (x,y) \in D vastaa yksikäsitteinen piste (u,v)\in G, jolle \mathbf{F}(u,v)= (x,y). Tällöin erityisesti D=\mathbf{F}(G).

muuttujanvaihto 
\big(x(u,v),y(u,v)\big)=\mathbf{F}(u,v)

Tutkitaan aluksi muuttujanvaihtoa tasointegraalin tapauksessa:  \iint_D f(x,y)\,dx\,dy = \iint_{G} ??? \,du\,dv. Tarvitaan tieto siitä, miten pinta-ala skaalautuu funktiossa (x,y) = \mathbf{F}(u,v).

muuttujanvaihto
Kuvassa \mathbf{a} (vast. \mathbf{b}) sijaitsee käyrällä, jolla v (vast. u) on vakio. Koska funktiolla \mathbf{F} on jatkuvat osittaisderivaatat, käyrät ovat sileitä.

Ketjusäännöllä  dx = \frac{\partial x}{\partial u}du + \frac{\partial x}{\partial v}dv\text{ ja } dy = \frac{\partial y}{\partial u}du + \frac{\partial y}{\partial v}dv. Edettäessä vektorin \mathbf{a} suuntaan (x,y)-koordinaateissa, koordinaatti v on vakio ja siten dv=0. Saadaan  \mathbf{a} \approx \frac{\partial x}{\partial u}du\,\mathbf{i} + \frac{\partial y}{\partial u}du\,\mathbf{j}. Samaan tapaan voidaan päätellä, että  \mathbf{b} \approx \frac{\partial x}{\partial v}dv\,\mathbf{i} + \frac{\partial y}{\partial v}dv\,\mathbf{j}. Tässä \mathbf{i} ja \mathbf{j} ovat koordinaattiakseleiden suuntaiset yksikkövektorit.

Approksimaatiokaava pinta-alaelementin dA muutokselle siis on  dA = dx \, dy \approx |\mathbf{a} \times \mathbf{b}| = \left\|\begin{array}{ccc} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ \frac{\partial x}{\partial u}du & \frac{\partial y}{\partial u}du & 0 \\ \frac{\partial x}{\partial v}dv & \frac{\partial y}{\partial v}dv & 0 \end{array}\right\| Käytetään merkintää (huom. neliömatriiseille \det A=\det A^T)  \left\|\begin{array}{cc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array}\right\|\,du\,dv := \big|\det D \mathbf{F}(u,v)\big|\,du\,dv. Determinantti \det D \mathbf{F}(u,v) on funktion \mathbf{F}\colon \mathbb{R}^2\to \mathbb{R}^2 Jacobin determinantti. Sille käytetään myös merkintää  \det D \mathbf{F}(u,v)=\frac{\partial(x,y)}{\partial(u,v)} \text{ kun } (x,y) = \mathbf{F}(u,v).

Jacobin determinantin itseisarvo |\det D \mathbf{F}(u,v)| kertoo paikallisen pinta-alan muutoksen kuvattaessa (u,v)-koordinaattien infinitesimaalinen pinta-ala du\,dv vastaavalle (x,y)-koordinaateissa lausutulle pinta-alalle dx\,dy funktion (x,y) = \mathbf{F}(u,v) välityksellä.

Tasointegraalin muuttujanvaihtokaavaksi siis saadaan  \iint_D f(x,y) \,dx\,dy = \iint_{G} g(u,v) \big | \det D\mathbf{F} (u,v)\big| \,du\,dv missä g(u,v)=f(x(u,v),y(u,v)) ja D=\mathbf{F}(G). Tässä \mathbf{F} on integroimisalueiden D ja G välinen bijektio. Jacobin determinantin etumerkki kertoo, onko \mathbf{F} suunnan säilyttävä vai kääntävä. Itseisarvo tarvitaan, jotta positiivisen funktion integraali ei muuttuisi negatiiviseksi eräillä \mathbf{F}.

Esimerkki

Lasketaan neljän paraabelin y=x^2, y=2x^2, x=y^2 ja x=3y^2 rajoittamaan alueen D pinta-ala.

Huomataan, että integroimisalue kuvautuu suorakulmioksi G = [1/2 , 1] \times [1/3 , 1] muunnoksella  \mathbf{G}(x,y) = u\mathbf{i} + v\mathbf{j}, \quad u(x,y)=\frac{x^2}{y},\,\,v(x,y)=\frac{y^2}{x}.

muuttujanvaihto
Integrointi suorakulmion yli on paljon helpompaa.

Halutaan kuitenkin käänteiskuvaus \mathbf{F} = \mathbf{G}^{-1}\colon G\to D, joka vie koordinaatit (u,v) käyräviivaisille (x,y)-koordinaateille. Lineaarialgebran perusteella  \det D {{\mathbf{F}}}(u,v)=\frac{1}{\det D \mathbf{G}(x,y)}. Lasketaan  \frac{\partial u}{\partial x} = \frac{2x}{y}, \quad \frac{\partial u}{\partial y} = -\frac{x^2}{y^2}. Saadaan myös  \frac{\partial v}{\partial x} = -\frac{y^2}{x^2}, \quad \frac{\partial v}{\partial y} = \frac{2y}{x}.

Lasketaan edelleen  \det D \mathbf{G}(x,y) = \left|\begin{array}{cc} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y} \\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \end{array}\right| = \left|\begin{array}{cc} \frac{2x}{y} & -\frac{x^2}{y^2} \\ -\frac{y^2}{x^2} & \frac{2y}{x} \end{array}\right|  = 4-1 = 3,\text{ eli } \big|\det D {\mathbf{F}} (u,v)\big|=\frac{1}{3}. Tulokseksi siis saadaan  \iint_D 1\,dx\,dy = \iint_G \frac{1}{3}\,du\,dv = \frac{1}{3}\cdot \frac{2}{3}\cdot \frac{1}{2} = \frac{1}{9}. Yleensä ei käy niin onnellisesti, että sama koordinaatistomuunnos vie integroitavan alueen suorakulmiolle samalla kun integroitava funktio menee vakioksi.

7.5. Muuttujanvaihto tasointegraalissa

Napakoordinaatit

Piste (x,y)\in \mathbb{R}^2 voidaan kirjoittaa muodossa (r,\theta), missä r\geq0 ja 0\le \theta < 2\pi. Napakulma \theta on yksikäsitteinen jos r > 0.

napakoordinaatisto

Alkeisgeometriasta saadaan kaavat  \left\{ \begin{array}{l} x=r\cos \theta\\ y=r\sin \theta \end{array}\right. \Leftrightarrow \left\{ \begin{array}{l} r^2=x^2+y^2 \\ \tan{\theta} = y/x. \end{array}\right. Vrt. kompleksiluvun polaarimuoto x + i y = r e^{i \theta}.

Koordinaatistomuunnoksen (r, \theta) \mapsto (x,y) Jacobin determinantille saadaan kaava  \frac{\partial(x,y)}{\partial (r,\theta)} = \left|\begin{array}{cc} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta}\\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{array}\right| = \left|\begin{array}{cc} \cos \theta & -r\sin \theta\\ \sin \theta & r\cos\theta \end{array}\right| = r. Siten muuttujanvaihtokaavaa varten saadaan pinta-alan venytys  dx\,dy = \bigg|\frac{\partial(x,y)}{\partial (r,\theta)}\bigg| \,dr\,d\theta = r\,dr\,d\theta. Tasointegraali napakoordinaateissa  \iint_D f(x,y)\,dx\,dy = \iint_G g(r,\theta)r\,dr\,d\theta, missä g(r,\theta) = f(r\cos\theta,r\sin\theta).

Esimerkki

(i) Olkoon D=\lbrace (x,y)\in \mathbb{R}^2 : 1 < x^2 + y^2 < 4\rbrace. Lasketaan napakoordinaateissa integraali  I=\iint_D \frac{1}{x^2+y^2}\,dx\,dy. Saadaan  I=\int_0^{2\pi}\int_1^2\frac{1}{r^2}r\,dr\,d\theta = \int_0^{2\pi} d\theta \cdot \int_1^2\frac{dr}{r} =2\pi\ln r\Big|_{r=1}^2 = 2\pi \ln 2.

(ii) Integraali  \int_{-\infty}^\infty e^{-x^2}\,dx on erittäin tärkeä mm. todennäköisyyslaskennassa ja tilastotieteessä. Tämä integraali on vaikea, koska integraalifunktiota ei ole mahdollista kirjoittaa alkeisfunktioiden avulla.

Integraali on kuitenkin mahdollista laskea seuraavan tempun avulla: Huomataan aluksi, että  I = \int_{-\infty}^\infty \int_{-\infty}^\infty e^{-x^2-y^2}\,dx\,dy = \bigg(\int_{-\infty}^\infty e^{-x^2}\,dx\bigg)^2. Laskemalla epäoleellinen tasointegraali napakoordinaateissa  I = \int_0^{2\pi}\int_0^\infty e^{-r^2}r\,dr\,d\theta = \int_0^{2\pi}d\theta \cdot \int_0^\infty r e^{-r^2}\,dr  = 2\pi \int_0^\infty{r e^{-r^2}\,dr} = -\pi \lim_{R \to \infty}{\int_0^R (-2r) e^{-r^2}\,dr}.

Nyt \frac{d}{dr} e^{-r^2} = -2r e^{-r^2}, joten integraaliksi saadaan:  \int_0^R (-2r) e^{-r^2}\,dr = e^{-R^2} - 1 Viemällä R \to \infty tulee I = \pi ja siitä alkuperäisen integraalin arvo  \int_{-\infty}^\infty e^{-x^2}\,dx = \sqrt{I} = \sqrt{\pi}. Miksi temppu toimi?

7.6. Muuttujanvaihto avaruusintegraalissa

Muuttujanvaihto avaruusintegraalissa

Muunnoskaavat (u,v,w) \mapsto (x,y,z) ovat  \left\{ \begin{array}{l} x=x(u,v,w),\\ y=y(u,v,w),\\ z=z(u,v,w). \end{array}\right. Tällöin  dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (u,v,w)}\bigg|\,du\,dv\,dw, missä  \frac{\partial(x,y,z)}{\partial (u,v,w)} = \left|\begin{array}{ccc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} & \frac{\partial x}{\partial w} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} & \frac{\partial y}{\partial w}\\ \frac{\partial z}{\partial u} & \frac{\partial z}{\partial v} & \frac{\partial z}{\partial w} \end{array}\right|. Jos siis g(u,v,w) = f(x(u,v,w),y(u,v,w),z(u,v,w)), niin  \iiint_D f(x,y,z)\,dx\,dy\,dz = \iiint_G g(u,v,w)\, \bigg|\frac{\partial(x,y,z)}{\partial (u,v,w)}\bigg|\,du\,dv\,dw.

Sylinterikoordinaatit

Koordinaatit (r,\theta,z), missä r \geq 0, 0\le \theta, z\in\mathbb{R}. Suoralla r = 0 (eli z-akselilla) napakulma \theta ei ole yksikäsitteinen.
sylinterikoordinaatisto

Tällöin muunnoskaavat (r,\theta,z) \mapsto (x,y,z) ovat \begin{align*} \begin{cases} x &= r\cos\theta, \\ y &= r\sin\theta, \\ z &= z. \end{cases} \end{align*} Ja muunnoksen Jacobin determinantiksi saadaan  dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (r,\theta,z)}\bigg|\,dr\,d\theta\,dz = r\,dr\,d\theta\,dz.

Sylinterikoordinaateissa on helppo esittää pyörähdyskappaleita z-akselin ympäri muodossa  r = f(z), \quad \text{jossa} \quad z \in [a,b] \text{ ja } \theta \in [0, 2 \pi), missä f on ei-negatiivinen funktio. Sylinterisymmetriset tehtävät!

Esimerkki

Lasketaan funktion f määräämän pyörähdyskappaleen \Omega tilavuus  \iiint_{\Omega} dx\, dy\, dz = \int_a^b\int_0^{2\pi}\int_0^{f(z)} r\,dr\,d\theta\,dz  = \int_a^b \left (2\pi \cdot \frac{1}{2}f(z)^2 \right ) \, dz = \pi \int_a^b f(z)^2 \, dz, mikä lienee tuttu kaava.

Pallokoordinaatit

Koordinaatit (r,\theta,\phi), missä r \geq 0, 0\le \theta, 0\le \phi \leq \pi.

palookoordinaatisto

Korotus- eli napakulmaa \pi/2 - \phi käytetään usein \phi:n sijasta. Atsimuuttikulma \theta ja korotuskulma ovat yksikäsitteisiä, jos pisteen etäisyys z-akselista  > 0. Muunnoskaavat ovat \begin{align*} \begin{cases} x&=r\sin\phi \cos\theta,\\ y&=r\sin\phi \sin\theta,\\ z&=r\cos\phi, \end{cases} \end{align*} ja muunnoksen Jacobin determinantiksi saadaan  dx\,dy\,dz = \bigg|\frac{\partial(x,y,z)}{\partial (r,\theta,\phi)}\bigg|\,dr\,d\theta\,d\phi = r^2\sin\phi \,dr\,d\theta\,d\phi.

Esimerkki

Lasketaan R-säteisen pallon \mathbb{B}^3(R) tilavuus:  V(\mathbb{B}^3) = \iiint_{\mathbb{B}^3(R)} 1\,dx\,dy\,dz = \int_0^R\int_0^{2\pi}\int_0^\pi r^2\sin\phi\,d\phi\,d\theta\,dr  = \int_0^R\int_0^{2\pi} -r^2\cos\phi\bigg|_{\phi=0}^\pi\,d\theta\,dr = \int_0^R\int_0^{2\pi} 2r^2\,d\theta\,dr  =\int_0^R 4\pi r^2\,dr = \frac{4\pi r^3}{3}\bigg|_{r=0}^R = \frac{4\pi R^3}{3}.

7.7. Epäoleelliset integraalit. Muuttujanvaihto taso- ja avaruusintegraaleissa

Epäoleelliset integraalit

Tähän asti integrointi on tapahtunut rajoitetussa alueessa rajoitetulle funktiolle (integrandille). Joskus voidaan kuitenkin integroida rajoittamattomia funktioita ja/tai rajoittamattomassa alueessa.

Tarkastellaan ainoastaan tapausta, jossa funktio f on ei-negatiivinen eli f(\mathbf{u}) \ge 0 kaikilla \mathbf{u}\in D. Lasketaan funktion f(x,y) = e^{-x^2} integraali alueessa suorien y=\pm x rajoittamassa rajoittamattomassa alueessa D, jossa x>0. Mikäli integraali on suppenee, sen arvo saadaan laskemalla  \iint_D e^{-x^2}\,dA = \int_0^\infty \int_{-x}^{x} e^{-x^2}\,dy\,dx = \int_0^\infty 2xe^{-x^2}\,dx  = \lim_{R\to \infty} \int_0^R 2xe^{-x^2}\,dx. Integraalin laskemiseksi huomataan, että \frac{d}{dx} e^{-x^2} = -2xe^{-x^2}. Siten  \lim_{R\to \infty} \int_0^R 2xe^{-x^2}\,dx = \lim_{R\to\infty} -e^{-x^2}\Big|_{x=0}^R = \lim_{R\to\infty}1-e^{-R^2}=1.

Esimerkki

Olkoon D_1=\lbrace (x,)\in \mathbb{R}^2 : 0 < x < 1, \, |y| \leq x^2 \rbrace ja rajoittamaton funktio f(x,y)=1/x^2.

(i) Lasketaan integraali  \iint_{D_1}\frac{1}{x^2}\,dA =\int_0^1\int_{-x^2}^{x^2}\frac{1}{x^2}\,dy\,dx  =\int_0^1 2\,dx =2.

Alue D_1
Alue D_1

(ii) Lasketaan saman funktion integraali alueessa D_2=\lbrace (x,y)\in\mathbb{R}^2 : 0 < x < 1,\, |y|\leq \sqrt{x}\rbrace.  \iint_{D_2}\frac{1}{x^2}\,dA =\int_0^1\int_{-\sqrt{x}}^{\sqrt{x}}\frac{1}{x^2}\,dy\,dx  =\int_0^1 2\sqrt{x}\frac{1}{x^2}\,dx =\int_0^1 2x^{-3/2}\,dx =\lim_{\epsilon\to 0+} \frac{2x^{-1/2}}{-1/2}\bigg|_{x=\epsilon}^1 = \infty. Suppeneminen riippuu integroitavan funktion lisäksi myös alueesta!

Alue D_2
Alue D_2

7.8. Pintaintegraali

Kaksiulotteinen pinta-ala avaruudessa

Tutkitaan kaksiulotteista kaareutuvaa pintaa S, joka on (piirtämisen helpottamiseksi) xy-tason yläpuolella avaruudessa \mathbb{R}^3.

Tarkastellaan aluksi xy-tason neliön yläpuolelle jäävän osan pinta-alaa. Se on ilmeisesti suurempi tai yhtäsuuri kuin vastaavan neliön pinta-ala.

Tästä johtuen pinta-aladifferentiaali dS on suurempi tai yhtäsuuri kuin kuin dx\,dy. Itseasiassa dx\,dy saadaan, jos dS projisoidaan xy-tasoon. Projektio voidaan kirjoittaa kaavana  dx\,dy = \cos \gamma\,dS, missä \gamma on pinnan S normaalivektorin \mathbf{N} ja z-akselin suuntaisen yksikkövektorin \mathbf{k} välinen kulma. Toisaalta pistetulon määritelmästä saadaan  \mathbf{N} \cdot \mathbf{k} = \|\mathbf{N}\| \|\mathbf{k}\| \cos \gamma, ja siis  dS = \frac{1}{\cos \gamma}\,dx\,dy = \frac{\|\mathbf{N}\| \|\mathbf{k}\|}{\mathbf{N} \cdot \mathbf{k}}\,dx\,dy.

Aikaisemmin on johdettu pinnan (ylöspäin suunnatulle) normaalivektorille esitys  \mathbf{N} = -\frac{\partial z}{\partial x}\mathbf{i} - \frac{\partial z}{\partial y}\mathbf{j} + \mathbf{k}. Saadaan  \|\mathbf{N}\| = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2} Lisäksi \|\mathbf{k} \| =1 ja \mathbf{N}\cdot \mathbf{k} = 1, joten  dS = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2}\,dx\,dy. Kaltevuuden huomioiva korjaustekijä yleistää tasointegraalin pintaintegraaliksi.

Esimerkki

Tarkastellaan sylinterin x^2+y^2=a^2, a>0 leikkaamaa palasta hyperbolisesta paraboloidista z=x^2-y^2. Mikä on palasen pinta-ala?

Lasketaan  \frac{\partial}{\partial x} z = 2x,\qquad \frac{\partial}{\partial y} z = -2y. Siten pinta-aladifferentiaaliksi saadaan  dS = \sqrt{1+ \Big(\frac{\partial z}{\partial x}\Big)^2 + \Big(\frac{\partial z}{\partial y}\Big)^2}\,dx\,dy  = \sqrt{ 1 + 4(x^2+y^2)} \,dx\,dy  =\sqrt{1+ 4r^2}\, r\,dr\,d\theta, napakoordinaateissa ilmaistuna.

Lasketaan nyt integraali napakoordinaateissa:  \textrm{Ala}(S)= \int_0^{2\pi} \int_0^a r\sqrt{1+4r^2}\,dr\,d\theta  = \frac{\pi}{4} \int_0^a 8r\sqrt{1+4r^2}\,dr  = \frac{\pi}{4} \bigg|_{r=0}^a\frac{2}{3}(1+4r^2)^{3/2} =\frac{\pi}{6} \big[(1+4a^2)^{3/2} -1\big].