VERKKOKIRJA

Site: MyCourses
Course: MS-A0103 - Differentiaali- ja integraalilaskenta 1 (ELEC1, ENG1), Luento-opetus, 4.9.2023-18.10.2023
Book: VERKKOKIRJA
Printed by: Guest user
Date: Sunday, 24 November 2024, 4:46 PM

Description

Differentiaali- ja integraalilaskenta - verkkokirja, tekijä Pekka Alestalo

Englanninkielisen MOOC-kurssin luentomateriaali, joka perustuu tämän kurssin luentoihin. Mukana on interaktiivisia JSXGraph-kuvia, joita ei ole suomenkielisissä luentokalvoissa. Toistaiseksi vain luvut 1-5, 7 ja 9 ovat suomeksi.

1. Jonot

Sisältö

  • Peruskäsitteet
  • Tärkeitä jonoja
  • Suppeneminen ja raja-arvo

Jonot


Tämä luku sisältää tärkeimmät jonoihin liittyvät käsitteet. Käsittelemme käytännössä vain reaalilukujonohin liittyviä asioita.

Määritelmä: Jono

Olkoon M epätyhjä joukko. Jono on funktio

f:\mathbb{N}\rightarrow M.

Usein käytetään nimitystä jono joukossa M.

Huom. Koska \mathbb{N} on järjestetty joukko, niin myös jonon termeillä  f(n) on vastaava järjestys. Sen sijaan joukon alkioilla ei yleisessä tapauksessa ole määrättyä järjestystä.

Määritelmä: Jonon termit ja indeksit

Jonoille voidaan käyttää myös merkintöjä

(a_{1}, a_{2}, a_{3}, \ldots) = (a_{n})_{n\in\mathbb{N}} = (a_{n})_{n=1}^{\infty} = (a_{n})_{n}

muodon f(n) sijaan. Luvut a_{1},a_{2},a_{3},\ldots\in M ovat jonon termejä.


 Funktion \begin{aligned} f:\mathbb{N} \rightarrow & M \\
		n \mapsto & a_{n}\end{aligned} perusteella jokaiseen jonon termiin liittyy yksikäsitteinen lukua n\in\mathbb{N} to each term. Se merkitään alaindeksinä ja sitä kutsutaan vastaavan jonon termin indeksiksi; jokainen jonon termi voidaan siis tunnistaa sen indeksin avulla.

n 1 2 3 4 5 6 7 8 9 \ldots
\downarrow \downarrow \downarrow \downarrow \downarrow \downarrow \downarrow \downarrow \downarrow
a_{n}

a_{1} a_{2} a_{3} a_{4} a_{5} a_{6} a_{7} a_{8} a_{9} \ldots

Esimerkkejä

Esimerkki 1: Luonnollisten lukujen jono

Jono (a_{n})_{n}, joka on määritelty kaavalla a_{n}:=n,\,n\in \mathbb{N} on nimeltään luonnollisten lukujen jono. Sen ensimmäiset termit ovat: a_1=1,\, a_2=2,\, a_3=3, \ldots


Esimerkki 2: Kolmiolukujen jono

Kolmioluvut saavat nimensä seuraavasta geometrisesta periaatteesta: Asetetaan sopiva määrä kolikoita niin, että syntyy yhä suurempia tasasivuisia kolmioita:


Ensimmäisen kolikon alle lisätään kaksi kolikkoa, jolloin toisessa vaiheessa saadaan a_2=3 kolikkoa. Seuraavaksi tämän kolmion alle lisätään kolme uutta kolikkoa, joita on nyt yhteensä a_3=6. Etenemällä samaan tapaan huomataan, että esimerkiksi 10. kolmioluku saadaan laskemalla yhteen 10 ensimmäistä luonnollista lukua: a_{10} = 1+2+3+\ldots+9+10. Yleinen kaava kolmiolukujonon termeille on a_{n} = 1+2+3+\ldots+(n-1)+n. Kolmioluvuille käytetään yleensä merkintää T_n (T = 'Triangle').


Tämä motivoi seuraavaan määritelmään:

Määritelmä: Summajono

Olkoon (a_n)_n, a_n: \mathbb{N}\to M jono joukossa  M, jossa on määritelty yhteenlasku.  Merkitään a_1 + a_2 + a_3 + \ldots + a_{n-1} + a_n =: \sum_{k=1}^n a_k. Symboli \sum on kreikkalainen kirjain sigma. Summausindeksi k kasvaa alkuarvosta 1 loppuarvoon n.

Summajono saadaan siis alkuperäisestä jonosta laskemalla alkupään termejä yhteen aina yksi termi eteenpäin. Varsinkin sarjojen kohdalla käytetään nimeä osasummajono.

Kolmiolukujen yleinen kaava voidaan siis kirjoittaa muodossa T_n = \sum_{k=1}^n k ja kyseessä on luonnollisten lukujen jonon summajono.

Esimerkki 3: Neliölukujen jono

Neliölukujen jono (q_n)_n määritellään kaavalla q_n=n^2. Tämän jonon termejä voidaan havainnollistaa asettelemalla kolikoita neliön muotoon.

Yksi mielenkiintoinen havainto on se, että kahden peräkkäisen kolmioluvun summa on aina neliöluku. Esimerkiksi 3+1=4 ja 6+3=9. Yleisesti määritelmiä käyttämällä voidaan osoittaa, että

q_n=T_n + T_{n-1}.


Esimerkki 4: Kuutiolukujen jono

Vastaavasti kuutiolukujen jono määritellään kaavalla a_n := n^3. Jonon ensimmäiset termit ovat silloin  (1,8,27,64,125,\ldots).


Esimerkki 5.

Olkoon (q_n)_n with q_n := n^2 neliölukujen jono \begin{aligned}(1,4,9,16,25,36,49,64,81,100 \ldots)\end{aligned} ja määritellään funktio \varphi(n) = 2n. Jonosta (q_{2n})_n saadaan \begin{aligned}(q_{2n})_n &= (q_2,q_4,q_6,q_8,q_{10},\ldots) \\
        &= (4,16,36,64,100,\ldots).\end{aligned}

Määritelmä: Erotusjono (differenssijono)

Jonon (a_{n})_{n}=a_{1},\, a_{2},\, a_{3},\ldots,\, a_{n},\ldots termeistä voidaan myös muodostaa peräkkäisten termien erotuksia: (a_{n+1}-a_{n})_{n}:=a_{2}-a_{1}, a_{3}-a_{2},\dots on nimeltään alkuperäisen jonon (a_{n})_{n} ensimmäinen differenssijono.

Ensimmäisen differenssijonon ensimmäinen differenssijono on alkuperäisen jonon  toinen differenssijono. sequence. Vastaavalla tavalla määritellään jonon n. differenssijono.

Esimerkki 6.

Tarkastellaan jonoa (a_n)_n, jossa a_n := \frac{n^2+n}{2}, eli \begin{aligned}(a_n)_n &= (1,3,6,10,15,21,28,36,\ldots)\end{aligned} Olkoon (b_n)_n sen 1. differenssijono. Silloin \begin{aligned}(b_n)_n &= (a_2-a_1, a_3-a_2, a_4-a_3,\ldots) \\
		&= (2,3,4,5,6,7,8,9,\ldots)\end{aligned}  Termin (b_n)_n yleinen muoto on \begin{aligned}b_n &= a_{n+1}-a_{n} \\
		&= \frac{(n+1)^2+(n+1)}{2} - \frac{n^2+n)}{2} \\
		&= \frac{(n+1)^2+(n+1)-n^2 - n }{2} \\
		&= \frac{(n^2+2n+1)+1-n^2}{2} \\
		&= \frac{2n+2}{2} \\
		&= n + 1.\end{aligned}

Eräitä tärkeitä jonoja


Eräät jonot ovat keskeisiä monille matemaattisille malleille ja niiden käytännön sovelluksille muilla aloilla kuten luonnontieteissä ja taloustieteissä.) Seuraavassa tarkastellaan kolme tällaista jonoa: aritmeettinen jono, geometrinen jono ja Fibonaccin lukujono.

Aritmeettinen jono

Aritmeettinen jono voidaan määritellä monella eri tavalla:
Määritelmä A: Aritmeettinen jono

Jono (a_{n})_{n} on aritmeettinen, jos sen peräkkäisten termien erotus d \in \mathbb{R} on vakio, t.s. a_{n+1}-a_{n}=d \text{ ja } d=vakio.

Huomautus: Aritmeettisen jonon eksplisiittinen kaava  seuraa suoraan määritelmästä A: a_{n}=a_{1}+(n-1)\cdot d. Aritmeettisen jonon n. termi voidaan laskea myös palautuskaavan (eli rekursiokaavan) avulla: a_{n+1}=a_n + d.

Määritelmä B: Aritmeettinen jono

Jono (a_{n})_{n} on aritmeettinen jono, jos sen ensimmäinen differenssijono on vakiojono.

Tämä määritelmä selventää myös aritmeettisen jonon nimen: Kolmen peräkkäisen termin keskimmäinen luku on kahden muun termin aritmeettinen keskiarvo; esimerkiksi

a_2 = \frac{a_1+a_3}{2}.

Esimerkki 1.

Luonnollisten lukujen jono (a_n)_n = (1,2,3,4,5,6,7,8,9,\ldots) on aritmeettinen, koska peräkkäisten termien erotus on d=1.

Geometrinen jono

Myös geometrisella jonolla on useita erilaisia määritelmiä:

Määritelmä: Geometrinen jono

Jono (a_{n})_{n} on geometrinen, jos kahden präkkäisen termin suhde on aina vakio q\in\mathbb{R}, t.s. \frac{a_{n+1}}{a_{n}}=q \text{ kaikille } n\in\mathbb{N}.

Huomautus. Palautuskaava a_{n+1} = q\cdot a_n geometrisen jonon termeille ja myös eksplisiittinen lauseke a_n=a_1\cdot q^{n-1} seuraavat suoraan määritelmästä.

Myös tässä jonon nimityksellä on looginen tausta: Kolmen peräkkäisen termin keskimmäinen luku on aina kahden muun termin geometrinen keskiarvo; esimerkiksi a_2 = \sqrt{a_1\cdot a_3}.

Esimerkki 2.

Olkoon a\in\mathbf{R} ja q\neq 0. Jono (a_n)_n, jolle a_n := aq^{n-1}, eli \left( a_1, a_2, a_3, a_4,\ldots \right) = \left( a, aq, aq^2, aq^3,\ldots \right), on geometrinen jono. Jos a> 0 ja q\geq1, niin jono on aidosti kasvava. Jos a>0 ja q, niin se on aidosti vähenevä. Jonon alkioiden muodostama joukko {a,aq,aq^2, aq^3} on äärellinen, jos q=1 (jolloin sen ainoa alkio on a), muuten tämä joukko on ääretön.

Fibonaccin jono

Fibonaccin lukujono on kuuluisa sen biologisten sovellusten vuoksi. Se esiintyy mm.eliöiden populaation kasvun yhteydessä ja kasvien rakenteessa. Palautuskaavaan perustuva määritelmä on seuraava:

Määritelmä: Fibonaccin jono

Olkoon a_0 = a_1 = 1 ja a_n := a_{n-2}+a_{n-1}, kun n\geq2. Jono (a_n)_n on Fibonaccin lukujono. Jonon termit ovat Fibonaccin lukuja.

Jonon nimen takana on italialainen Leonardo Pisano (1200-luvulla), latinalaiselta nimeltään Filius Bonacci. Hän tutki kaniparien lisääntymistä idealisoidussa tilanteessa, jossa kanit eivät kuole ja kaikki vanhat sekä uudet parit lisääntyvät säännöllisin väliajoin. Näin hän päätyi jonoon (1,1,2,3,5,8,13,21,34,55,\ldots).


Esimerkki 3.

Auringonkukan kukat muodostuvat kahdesta spiraalista, jotka aukeavat keskeltä vastakkaisiin suuntiin: 55 spiraalia myötäpäivään ja 34  vastapäivään.

Myös ananashedelmän pinta käyttäytyy samalla tavalla. Siinä on 21 spiraalia yhteen suuntaan ja 34 vastakkaiseen. Myös joissakin kaktuksissa ja havupuiden kävyissä on samanlaisia rakenteita.


Suppeneminen, hajaantuminen ja raja-arvo


Tässä luvussa käsitellään jonon suppenemista. Aloitamme nollajonon käsitteestä ja siirrymme sen avulla yleiseen suppenemisen käsitteeseen.

Huomautus: Itseisarvo joukossa \mathbb{R}

Itseisarvofunktio x \mapsto |x| on keskeisessä asemassa jonojen suppenemisen tutkimisessa. Seuraavassa käydään läpi sen tärkeimmät ominaisuudet:

Määritelmä: Itseisarvo

Reaaliluvun x\in\mathbb{R}  itseisarvo |x| on \begin{aligned}|x|:=\begin{cases}x, & \text{jos }x\geq0,\\
		-x, & \text{jos }x

Itseisarvofunktion kuvaaja


Lause: Itseisarvon laskusääntöjä

Kaikille reaaliluvuille x,y\in\mathbb{R} pätee:

  1. |x|\geq0,

  2. |x|=0 täsmälleen silloin, kun x=0.

  3. |x\cdot y|=|x|\cdot|y| (multiplikatiivisuus)

  4. |x+y|\leq|x|+|y| (kolmioepäyhtälö)

Todistus.

Kohdat 1.-3. Results follow directly from the definition and by dividing it up into separate cases of the different signs of x and y

Kohta 4. Tämä kohta voidaan todistaa neliöön korottamalla tai tutkimalla kaikki eri vaihtoehdot kuten alla.
Tapaus 1.

Olkoot x,y \geq 0. Silloin \begin{aligned}|x+y|=x+y=|x|+|y|\end{aligned} ja kaava pätee.

Tapaus 2.

Olkoot seuraavaksi x,y < 0. Silloin \begin{aligned}|x+y|=-(x+y)=(-x)+ (-y)=|x|+|y|.\end{aligned}

Tapaus  3.

Tutkitaan lopuksi tapaus x\geq 0 and y, joka jakaantuu kahteen alakohtaan:

  • Jos x \geq -y, niin x+y\geq 0 ja siten |x+y|=x+y määritelmän perusteella. Koska y, niin y ja sen vuoksi x+y < x-y. Siis \begin{aligned}|x+y| = x+y < x-y = |x|+|y|.\end{aligned}

  • Jos x < -y, niin x+y, ja tällöin |x+y|=-(x+y)=-x-y. Koska x\geq0, niin -x < x ja siten -x-y\leq x-y. Siispä \begin{aligned}|x+y| = -x-y \leq x-y = |x|+|y|.\end{aligned}

Tapaus 4.

Jos x ja y\geq0, niin väite seuraa samalla periaatteella kuin tapauksessa 3, kun vaihdetaan keskenään x ja y.

\square

Nollajono

Määritelmä: Nollajono

Jono (a_{n})_{n} on nollajono, jos jokaista \varepsilon>0, vastaa sellainen indeksi n_{0}\in\mathbb{N}, että |a_{n}| < \varepsilon kaikille n\geq n_{0},\, n\in\mathbb{N}. Tällöin sanotaan, että jono suppenee kohti nollaa.

Intuitiivisesti: Nollajonon termit menevät mielivaltaisen lähelle nollaa, kun jonossa mennään riittävän pitkälle.

Esimerkki 1.

Jono (a_n)_n, joka on määritelty kaavalla a_{n}:=\frac{1}{n}, eli \left(a_{1},a_{2},a_{3},a_{4},\ldots\right):=\left(\frac{1}{1},\frac{1}{2},\frac{1}{3},\frac{1}{4},\ldots\right) on nimeltään harmoninen jono. Jonon termit ovat positiivisia kaikilla n\in\mathbb{N}, mutta indeksin n kasvaessa jonon termit pienenevät yhä lähemmäksi nollaa.
 Jos esimerkiksi \varepsilon := \frac{1}{5000}, niin valinnalla n_0 = 5001 pätee a_n aina, kun n\geq n_0.

Harmoninen jono suppenee kohti nollaa

Esimerkki 2.

Tarkastellaan jonoa (a_n)_n \text{ jossa } a_n:=\frac{1}{\sqrt{n}}. Olkoon \varepsilon := \frac{1}{1000}. Tällöin valinnalla n_0=1000001 kaikille termeille a_n, joissa n\geq n_0, pätee a_n < \frac{1}{1000}=\varepsilon.

Note. Tutkittaessa nollajono-ominaisuutta täytyy tutkia mielivaltaista lukua \varepsilon \in \mathbb{R}, jolle \varepsilon > 0. Sen jälkeen yritetään valita sellainen indeksi n_0, josta alkaen jokainen |a_n| on pienempi kuin \varepsilon.

Esimerkki 3.

Tarkastellaan jonoa (a_n)_n, jossa a_n := \left( -1 \right)^n \cdot \frac{1}{n^2}.

Kerrointen (-1)^n vuoksi jonon kaksi peräkkäistä termiä ovat aina erimerkkisiä; tällaista jonoa kutsutaan yleisemmin vuorottelevaksi jonoksi.

Osoitetaan, että kyseessä on nollajono. Määritelmän mukaan jokaista \varepsilon > 0 täytyy vastata sellainen n_0 \in \mathbb{N}, että epäyhtälö |a_n|< \varepsilon pätee kaikille niille termeille a_n, joissa n\geq n_0.

Todistus.

Olkoon siis \varepsilon > 0 mielivaltainen. Koska epäyhtälön  |a_n|< \varepsilon täytyy olla voimassa kaikille \varepsilon>0, indeksin n_0 täytyy riippua luvusta \varepsilon. Tarkemmin:  Epäyhtälön |a_{n_0}|=\left| \frac{1}{{n_0}^2} \right|= \frac{1}{{n_0}^2} täytyy toteutua indeksillä n_0. Ratkaistaan n_0: n_0 > \frac{1}{\sqrt{\varepsilon}}.. Mikä tahansa tämän ehdon toteuttava indeksi n_0 kelpaa valinnaksi, kun \varepsilon > 0 on alussa kiinnitetty.

Hajaantuvia esimerkkejä

Seuraavat kaavat eivät johda nollajonoon:

  • a_n = (-1)^n

  • a_n = (-1)^n \cdot n

Lause: Nollajonojen ominaisuuksia

Olkoot (a_n)_n ja (b_n)_n jonoja. Silloin pätee:

  1. Jos (a_n)_n on nollajono ja joko b_n = a_n tai b_n = -a_n kaikilla n\in\mathbb{N}, niin (b_n)_n on myös nollajono.

  2. Jos (a_n)_n on nollajono ja -a_n\leq b_n \leq a_n kaikilla n\in\mathbb{N}, niin (b_n)_n on myös nollajono.

  3. Jos (a_n)_n on nollajono, niin (c\cdot a_n)_n, c \in \mathbb{R}, on myös nollajono.

  4. Jos (a_n)_n ja (b_n)_n ovat nollajonoja, niin (a_n + b_n)_n on myös nollajono.

Todistus.

Parts 1 and 2. If (a_n)_n is a zero sequence, then according to the definition there is an index n_0 \in \mathbb{N}, such that |a_n| for every n\geq n_0 and an arbitrary \varepsilon\in\mathbb{R}. But then we have |b_n|\leq|a_n|; this proves parts 1 and 2 are correct.

Part 3. If c=0, then the result is trivial. Let c\neq0 and choose \varepsilon > 0 such that \begin{aligned}|a_n| for all n\geq n_0. Rearranging we get: \begin{aligned} |c|\cdot|a_n|=|c\cdot a_n|

Part 4.

Because (a_n)_n is a zero sequence, by the definition we have |a_n| for all n\geq n_0. Analogously, for the zero sequence (b_n)_n there is a m_0 \in \mathbb{N} with |b_n| for all n\geq m_0.

Then for all n > \max(n_0,m_0) it follows (using the triangle inequality) that: \begin{aligned}|a_n + b_n|\leq|a_n|+|b_n|

\square

Suppeneminen ja hajaantuminen

Nollajonoja voidaan käyttää tutkimaan jonojen suppenemista yleisemmin:

Määritelmä: Suppeneminen ja hajaantuminen

Jono (a_{n})_{n} suppenee kohti raja-arvoa a\in\mathbb{R}, jos jokaista \varepsilon>0 vastaa sellainen n_{0}, että |a_{n}-a| \lt \varepsilon \text{ kaikille niille }n\in\mathbb{N}_{0},\text{ joille }n\geq n_{0}.

Tämän kanssa on yhtäpitävää:

Jono (a_{n})_{n} suppenee kohti raja-arvoa a\in\mathbb{R}, jos (a_{n}-a)_{n} on nollajono.

Esimerkki 4.

Tarkastellaan jonoa (a_n)_n, jossa a_n=\frac{2n^2+1}{n^2+1}. Laskemalla jonon termejä suurilla n, huomataan, että ilmeisesti  a_n\to 2, kun  n \to \infty, joten jonon raja-arvo voisi olla a=2.

Todistus.

For a rigorous proof, we show that for every \varepsilon > 0 there exists an index n_0\in\mathbb{N}, such that for every term a_n with n>n_0 the following relationship holds: \left| \frac{2n^2+1}{n^2+1} - 2\right| < \varepsilon.

Firstly we estimate the inequality: \begin{aligned}\left|\frac{2n^2+1}{n^2+1}-2\right| =&\left|\frac{2n^2+1-2\cdot\left(n^2+1\right)}{n^2+1}\right| \\
			=&\left|\frac{2n^2+1-2n^2-2}{n^2+1}\right| \\
			=&\left|-\frac{1}{n^2+1}\right| \\
			=&\left|\frac{1}{n^2+1}\right| \\

Now, let \varepsilon > 0 be an arbitrary constant. We then choose the index n_0\in\mathbb{N}, such that n_0 > \frac{1}{\varepsilon} \text{, or equivalently, }  \frac{1}{n_0} < \varepsilon. Finally from the above inequality we have: \left|\frac{2n^2+1}{n^2+1}-2\right| < \frac{1}{n} < \frac{1}{n_0} < \varepsilon, Thus we have proven the claim and so by definition a=2 is the limit of the sequence.

\square

Jos jono suppenee, niin sillä voi olla vain yksi raja-arvo.

Lause: Raja-arvon yksikäsitteisyys
Oletetaan, että jono (a_{n})_{n} suppenee kohti raja-arvoa a\in\mathbb{R} ja kohti raja-arvoa b\in\mathbb{R}. Silloin a=b.

Todistus.

Assume a\ne b; choose \varepsilon\in\mathbb{R} with \varepsilon:=\frac{1}{3}|a-b|. Then in particular [a-\varepsilon,a+\varepsilon]\cap[b-\varepsilon,b+\varepsilon]=\emptyset.

Because (a_{n})_{n} converges to a, there is, according to the definition of convergence, a index n_{0}\in\mathbb{N} with |a_{n}-a|< \varepsilon for n\geq n_{0}. Furthermore, because (a_{n})_{n} converges to b there is also a \widetilde{n_{0}}\in\mathbb{N} with |a_{n}-b|< \varepsilon for n\geq\widetilde{n_{0}}. For n\geq\max\{n_{0},\widetilde{n_{0}}\} we have: \begin{aligned}\varepsilon\ = &\ \frac{1}{3}|a-b| \Rightarrow\\
			3\varepsilon\ = &\ |a-b|\\
			= &\ |(a-a_{n})+(a_{n}-b)|\\
			\leq &\ |a_{n}-a|+|a_{b}-b|\\
			< &\ \varepsilon+\varepsilon=2\varepsilon,\end{aligned} Consequently we have obtained 3\varepsilon\leq2\varepsilon, which is a contradiction as \varepsilon>0. Therefore the assumption must be wrong, so a=b.

\square


Määritelmä: Raja-arvo
Suppenevan jonon raja-arvolle käytetään merkintöjä

a_{n}\rightarrow a,\text{ tai }\lim_{n\rightarrow\infty}a_{n}=a. Määritelmä on yksikäsitteinen yllä olevan lauseen perusteella. Jos jonolla ei ole raja-arvoa, niin se hajaantuu.


Lause: Rajoitettu jono

Suppeneva jono (a_n)_n on rajoitettu, t.s. on olemassa sellainen vakio C\in\mathbb{R} että
|a_n| \lt C
kaikilla n\in\mathbb{N}.

Todistus.

We assume that the sequence (a_n)_n has the limit a. By the definition of convergence, we have that |a_n - a| for all \varepsilon \in \mathbb{R} and n\geq n_0. Choosing \varepsilon = 1 gives:
\begin{aligned}|a_n|-|a|&\ \leq |a_n -a| \\
			&\ < 1,\end{aligned} And therefore also |a_n|\leq |a|+1.

Thus for all n\in \mathbb{N}: |a_n|\leq \max \left\{ |a_1|,|a_2|,\ldots,|a_{n_0}|,|a|+1 \right\}=:r

\square

Suppenevien jonojen ominaisuuksia

Lause: Osajono

Olkoon (a_{n})_{n} suppeneva jono, jolle a_{n}\rightarrow a ja olkoon (a_{\varphi(n)})_{n} jonon (a_{n})_{n} osajono. Silloin (a_{\varphi(n)})_{n}\rightarrow a.

Sanallisesti: Suppenevan jonon kaikki osajonot suppenevat kohti alkuperäisen jonon raja-arvoa.

Todistus.

By the definition of a subsequence \varphi(n)\geq n. Because a_{n}\rightarrow a it is implicated that |a_{n}-a| for n\geq n_{0}, therefore |a_{\varphi(n)}-a| for these indices n.

\square


Lause: Laskusääntöjä

Olkoot (a_{n})_{n} ja (b_{n})_{n} suppenevia jonoja, joille a_{n}\rightarrow a ja b_{n}\rightarrow b. Silloin kaikille \lambda, \mu \in \mathbb{R} pätee:

  1. \lambda \cdot (a_n)+\mu \cdot (b_n) \to \lambda \cdot a + \mu \cdot b

  2. (a_n)\cdot (b_n) \to a\cdot b

Sanallisesti: Suppenevien jonojen summat ja tulot ovat suppenevia jonoja.

Todistus.

Part 1. Let \varepsilon > 0. We must show, that for all n \geq n_0 it follows that: |\lambda \cdot a_n + \mu \cdot b_n - \lambda \cdot a - \mu  \cdot b| < \varepsilon. The left hand side we estimate using: |\lambda (a_n-a)+\mu (b_n - b)| \leq |\lambda|\cdot|a_n-a|+|\mu|\cdot|b_n-b|.

Because (a_n)_n and (b_n)_n converge, for each given \varepsilon > 0 it holds true that: \begin{aligned}|a_n - a|

Therefore \begin{aligned}|\lambda|\cdot|a_n-a|+|\mu|\cdot|b_n-b| < &\ |\lambda|\varepsilon_1 + |\mu|\varepsilon_2 \\
			= &\ \textstyle{ \frac{\varepsilon}{2} + \frac{\varepsilon}{2} } = \varepsilon\end{aligned} for all numbers n \geq \max \{n_0,n_1\}. Therefore the sequence \left( \lambda \left( a_n - a \right) + \mu \left( b_n - b \right) \right)_n is a zero sequence and the desired inequality is shown.

Part 2. Let \varepsilon > 0. We have to show, that for all n > n_0 |a_n b_n - a b| < \varepsilon. Furthermore an estimation of the left hand side follows: \begin{aligned}
			|a_n b_n - a b| =&\ |a_n b_n - a b_n + a b_n - ab| \\
			\leq &\ |b_n|\cdot|a_n-a| + |a|\cdot|b_n - b|.\end{aligned} We choose a number B, such that |b_n| \lt b for all n and |a| \lt b. Such a value of B exists by the Theorem of convergent sequences being bounded. We can then use the estimation: \begin{aligned}|b_n|\cdot|a_n-a| + |a|\cdot|b_n - b| For all n>n_0 we have |a_n - a| and |b_n - b|, and - putting everything together - the desired inequality it shown.

\square

'; }], { useMathJax: true, fixed: true, strokeOpacity: 0.6 }); bars.push(newbar(k)); } board.fullUpdate(); })(); /* geometric sequence */ (function() { var board = JXG.JSXGraph.initBoard('jxgbox02', { boundingbox: [-1, 25, 11, -5], axis: false, shownavigation: false, showcopyright: false }); var xaxis = board.create('axis', [ [0, 0], [1, 0] ], { straightFirst: false, highlight: false, drawZero: true, scaleSymbol: 'a', ticks: { drawLabels: false, minorTicks: 0, majorHeight: 15, label: { highlight: false, offset: [0, -15] } } }); var yaxis = board.create('axis', [ [0, 0], [0, 1] ], { straightFirst: false, highlight: false, ticks: { minorTicks: 0, majorHeight: 15, label: { offset: [-15, 0], position: 'lrt', highlight: false } } }); xaxis.defaultTicks.ticksFunction = function() { return 1; }; yaxis.defaultTicks.ticksFunction = function() { return 5; }; var a = .5, q = 3 / 2; var newbar = function(k) { var height = a * Math.pow(q, k - 1); return board.create('polygon', [ [k - 1 / 4, 0], [k + 1 / 4, 0], [k + 1 / 4, height], [k - 1 / 4, height] ], { vertices: { visible: false }, borders: { strokeColor: 'black', strokeOpacity: .6, highlight: false }, fillColor: '#b2caeb', fixed: true, highlight: false }); } var bars = []; for (var i = 0; i < 10; i++) { const k = i + 1; board.create('text', [k - .1, -.6, function() { return 'a_{' + k + '}'; }], { useMathJax: true, fixed: true, strokeOpacity: 0.6 }); bars.push(newbar(k)); } board.fullUpdate(); })(); /* fibonacci sequence */ (function() { var board = JXG.JSXGraph.initBoard('jxgbox03', { boundingbox: [-1, 40, 10, -5], axis: false, shownavigation: false, showcopyright: false }); var xaxis = board.create('axis', [ [0, 0], [1, 0] ], { straightFirst: false, highlight: false, drawZero: true, ticks: { drawLabels: false, minorTicks: 0, majorHeight: 15, label: { highlight: false, offset: [0, -15] } } }); var yaxis = board.create('axis', [ [0, 0], [0, 1] ], { straightFirst: false, highlight: false, ticks: { minorTicks: 0, majorHeight: 15, label: { offset: [-15, 0], position: 'lrt', highlight: false } } }); xaxis.defaultTicks.ticksFunction = function() { return 1; }; yaxis.defaultTicks.ticksFunction = function() { return 5; }; var a_k = [1, 1]; var newbar = function(k) { var y; if (k - 1 > a_k.length - 1) { y = a_k[k - 3] + a_k[k - 2]; a_k.push(y); } else { y = a_k[k - 1]; } return board.create('polygon', [ [k - 1 / 4, 0], [k + 1 / 4, 0], [k + 1 / 4, y], [k - 1 / 4, y] ], { vertices: { visible: false }, borders: { strokeColor: 'black', strokeOpacity: .6, highlight: false }, fillColor: '#b2caeb', fixed: true, highlight: false }); } var bars = []; for (var i = 0; i < 9; i++) { const k = i + 1; board.create('text', [k - .1, -.6, function() { return 'a_{' + k + '}'; }], { useMathJax: true, fixed: true, strokeOpacity: 0.6 }); bars.push(newbar(k)); } board.fullUpdate(); })(); '; }], { useMathJax: true, strokeColor: '#2183de', fontSize: 13, fixed: true, highlight: false }); board.fullUpdate(); })(); '; }], { useMathJax: true, fixed: true, strokeOpacity: 0.6 }); board.create('point', [i, 1 / i], { size: 4, name: '', strokeWidth: .5, strokeColor: 'black', face: 'diamond', fillColor: '#cf4490', fixed: true }); } board.fullUpdate(); })();

2. Sarjat

Suppeneminen


Suppeneminen

Jonosta (a_k) voidaan muodostaa sen osasummia asettamalla s_n =a_1+a_2+\dots+a_n.

Jos osasumminen jonolla (s_n) on raja-arvo s\in \mathbb{R}, niin luvuista (a_k) muodostettu sarja suppenee ja sen summa on s. Tällöin merkitään 
		a_1+a_2+\dots =\sum_{k=1}^{\infty} a_k = \lim_{n\to\infty}\underbrace{\sum_{k=1}^{n} a_k}_{=s_{n}} = s.

Indeksöinti

Osasummat kannattaa indeksöidä samalla tavalla kuin alkuperäinen jono (a_k); esimerkiksi jonon (a_k)_{k=0}^{\infty} osasummat ovat s_0= a_0, s_1=a_0+a_1 jne.

Sarjaan voidaan tehdä indeksinsiirtoja ilman että varsinainen sarja muuttuu: \sum_{k=1}^{\infty} a_k =\sum_{k=0}^{\infty} a_{k+1} = \sum_{k=2}^{\infty} a_{k-1}.

Konkreettinen esimerkki: \sum_{k=1}^{\infty} \frac{1}{k^2}=1+\frac{1}{4}+\frac{1}{9}+\dots= \sum_{k=0}^{\infty} \frac{1}{(k+1)^2}

Kokeile!

Laske sarjan \displaystyle\sum_{k=0}^{\infty}a_{k} osasummia:

sarjan k. termi: , aloita summaus kohdasta

Sarjan hajaantuminen

Sarja, joka ei suppene, on hajaantuva. Tämä voi tapahtua kolmella eri tavalla:

  1. sarjan osasummat kasvavat rajatta kohti ääretöntä
  2. sarjan osasummat pienenevät rajatta kohti miinus ääretöntä
  3. osasummien jono heilahtelee niin, ettei sillä ole raja-arvoa.

Hajaantuvan sarjan kohdalla merkintä \displaystyle\sum_{k=1}^{\infty} a_k ei oikeastaan tarkoita mitään (se ei ole reaaliluku). Tällöin voidaan tulkita, että merkintä tarkoittaa osasummien jonoa, joka on aina hyvin määritelty.

Perustuloksia


Geometrinen sarja

Geometrinen sarja \sum_{k=0}^{\infty} aq^k suppenee, jos |q| (tai a=0), jolloin sen summa on \frac{a}{1-q}. Jos |q|\ge 1, niin sarja hajaantuu.

Todistus. Osasummille on voimassa \sum_{k=0}^{n} aq^k =\frac{a(1-q^{n+1})}{1-q}, josta väite seuraa.
\square

Yleisemmin \sum_{k=i}^{\infty} aq^k = \frac{aq^i}{1-q} = \frac{\text{sarjan 1. termi}}{1-q},\text{ jos } |q|

Esimerkki 1.

Määritä sarjan \sum_{k=1}^{\infty}\frac{3}{4^{k+1}} summa.

Ratkaisu. Koska \frac{3}{4^{k+1}}  = \frac{3}{4}\cdot \left( \frac{1}{4}\right)^k, niin kyseessä on geometrinen sarja. Sen summa on \frac{3}{4}\cdot \frac{1/4}{1-1/4} = \frac{1}{4}.

Laskusääntöjä

Suppenevien sarjojen ominaisuuksia:
  • \displaystyle{\sum_{k=1}^{\infty} (a_k+b_k) = \sum_{k=1}^{\infty} a_k + \sum_{k=1}^{\infty} b_k}
  • \displaystyle{\sum_{k=1}^{\infty} (c\, a_k) = c\sum_{k=1}^{\infty} a_k}, kun c\in \mathbb{R} on vakio

Todistus. Nämä seuraavat vastaavista tuloksista jonojen raja-arvolle.
\square


Huomautus: Sarjoilla ei ole jonojen kaltaista tulosääntöä, koska jo kahden termin summille (a_1+a_2)(b_1+b_2) \neq a_1b_1 +a_2b_2. Tulosäännön oikea muoto on sarjojen Cauchy-tulo, jossa myös ristitermit otetaan huomioon.

Katso esimerkiksi https://en.wikipedia.org/wiki/Cauchy_product

Lause 1.

Jos sarja \displaystyle{\sum_{k=1}^{\infty} a_k} suppenee, niin \displaystyle{\lim_{k\to \infty} a_k =0}.

Kääntäen: Jos \displaystyle{\lim_{k\to \infty} a_k \neq 0}, niin sarja \displaystyle{\sum_{k=1}^{\infty} a_k} hajaantuu.

Todistus.

Jos sarjan summa on s, niin a_k=s_k-s_{k-1}\to s-s=0.
\square


Huomautus: Ominaisuutta \lim_{k\to \infty} a_k = 0 ei voi käyttää sarjan suppenemisen osoittamiseen; vrt. seuraavat esimerkit. Tämä on eräs yleisimmistä päättelyvirheistä sarjojen kohdalla!

Esimerkki

Tutki sarjan \sum_{k=1}^{\infty} \frac{k}{k+1} = \frac{1}{2}+\frac{2}{3}+\frac{3}{4}+\dots suppenemista.

Ratkaisu. Sarjan yleisen termin raja-arvo on \lim_{k\to\infty}\frac{k}{k+1} = 1. Koska raja-arvo ei ole nolla, niin sarja hajaantuu.

Harmoninen sarja

Harmoninen sarja \sum_{k=1}^{\infty} \frac{1}{k} = 1+\frac{1}{2}+\frac{1}{3}+\dots hajaantuu, vaikka yleisen termin a_k=1/k raja-arvo on nolla.

Todistus.

Tämän klassisen tuloksen todisti ensimmäisenä 14. vuosisadalla Nicole Oresme, jonka jälkeen monia muitakin perusteluja on keksitty. Tässä esimerkkinä kaksi erilaista päättelyä.

i) Alkeellinen todistus. Oletetaan, että sarja suppenee ja yritetään johtaa tästä ristiriita. Olkoon siis s\in\mathbb{R} harmonisen sarjan summa: s = \sum_{k=1}^{\infty}1/k. Tällöin 
			s = \left(\color{#4334eb}{1} + \color{#eb7134}{\frac{1}{2}}\right) + \left(\color{#4334eb}{\frac{1}{3}} + 
			\color{#eb7134}{\frac{1}{4}}\right) + \left(\color{#4334eb}{\frac{1}{5}} + \color{#eb7134}{\frac{1}{6}}\right) + \dots
			= \sum_{k=1}^{\infty}\left(\color{#4334eb}{\frac{1}{2k-1}} + \color{#eb7134}{\frac{1}{2k}}\right).
			Selvästi 
			\color{#4334eb}{\frac{1}{2k-1}} > \color{#eb7134}{\frac{1}{2k}} > 0 \text{ kaikille }k\ge 1~\Rightarrow~\sum_{k=1}^{\infty}\color{#4334eb}{\frac{1}{2k-1}} > \sum_{k=1}^{\infty}\color{#eb7134}{\frac{1}{2k}} = \frac{s}{2},
			joten 
			s = \sum_{k=1}^{\infty}\color{#4334eb}{\frac{1}{2k-1}} + \sum_{k=1}^{\infty}\color{#eb7134}{\frac{1}{2k}} = \sum_{k=1}^{\infty}\color{#4334eb}{\frac{1}{2k-1}} + \frac{1}{2}\underbrace{\sum_{k=1}^{\infty}\frac{1}{k}}_{=s}.
			
			= \sum_{k=1}^{\infty}\color{#4334eb}{\frac{1}{2k-1}} + \frac{s}{2} > \sum_{k=1}^{\infty}\color{#eb7134}{\frac{1}{2k}} + \frac{s}{2} = \frac{s}{2} + \frac{s}{2} = s.
			Päädyimme siis epäyhtälöön s>s, joka on ristiriita. Alkuperäinen oletus suppenemisesta on siis väärä, joten sarja hajaantuu.

\square


ii) Todistus integraalin avulla: Pylvään korkeuksia 1/k vastaavan histogrammin alapuolelle jää funktion f(x)=1/(x+1) kuvaaja, joten pinta-aloja vertaamalla saadaan \sum_{k=1}^{n} \frac{1}{k} \ge \int_0^n\frac{dx}{x+1} =\ln(n+1)\to\infty, kun n\to\infty.
\square

Positiiviset sarjat

Sarjan summan laskeminen on usein vaikeata ja monesti jopa mahdotonta, jos vaatimuksena on summan eksplisiittinen lauseke. Moniin sovelluksiin riittää myös summan likiarvo, mutta sitä ennen olisi syytä selvittää, onko sarja suppeneva vai hajaantuva.

Sarja \displaystyle{\sum_{k=1}^{\infty} p_k} on positiivinen (tai positiiviterminen), jos p_k > 0 kaikilla k.

Positiivisten sarjojen suppeneminen on hyvin selväpiirteistä:

Lause 2.

Positiivinen sarja suppenee täsmälleen silloin, kun sen osasummien jono on ylhäältä rajoitettu.

Syy: Osasummien jono on nouseva.

Esimerkki

Osoita, että superharmonisen sarjan \sum_{k=1}^{\infty}\frac{1}{k^2} osasummille pätee s_n kaikilla n, joten sarja suppenee.

Ratkaisu. Ratkaisu perustuu epäyhtälöön \frac{1}{k^2} < \frac{1}{k(k-1)} = \frac{1}{k-1}-\frac{1}{k}, kun k\ge 2, koska sen mukaan \sum_{k=1}^n\frac{1}{k^2} < 1+ \sum_{k=2}^n\frac{1}{k(k-1)} =2-\frac{1}{n}< 2 kaikilla n\ge 2.

Tämän päättelyn voi tehdä myös integraalin avulla.


Leonhard Euler selvitti vuonna 1735, että sarjan summa on \pi^2/6. Perusteluna hän käytti sinifunktion sarja- ja tulokehitelmien vertailua.

Itseinen suppeneminen


Määritelmä

Sarja \displaystyle{\sum_{k=1}^{\infty} a_k} suppenee itseisesti, jos positiivinen sarja \sum_{k=1}^{\infty} |a_k| suppenee.


Lause 3.

Itseisesti suppeneva sarja suppenee (tavallisessa mielessä) ja \left| \sum_{k=1}^{\infty} a_k \right| \le \sum_{k=1}^{\infty} |a_k|.

Tämä on erikoistapaus majoranttiperiaatteesta, josta lisää myöhemmin.

Todistus.

Oletetaan, että \sum_k |a_k| suppenee. Tarkastellaan erikseen  sarjan \sum_k a_k positiivista ja negatiivista osaa: Olkoon b_k=\max (a_k,0)\ge 0 \text{ ja } c_k=-\min (a_k,0)\ge 0. Koska b_k,c_k\le |a_k|, niin positiiviset sarjat \sum b_k ja \sum c_k suppenevat  lauseen 2  perusteella. Lisäksi a_k=b_k-c_k, joten \sum a_k suppenee kahden suppenevan sarjan erotuksena.
\square

Esimerkki

Tutki vuorottelevan (= etumerkit vaihtelevat vuorotellen + ja -) sarjan \sum_{k=1}^{\infty}\frac{(-1)^{k+1}}{k^2}=1-\frac{1}{4}+\frac{1}{9}-\dots suppenemista.

Ratkaisu. Koska \displaystyle{\left| \frac{(-1)^{k+1}}{k^2}\right| =\frac{1}{k^2}} ja superharmoninen sarja \sum_{k=1}^{\infty}\frac{1}{k^2} suppenee, niin tutkittava sarja suppenee itseisesti, ja sen vuoksi myös tavallisessa mielessä.

Vuorotteleva harmoninen sarja

Itseinen suppeneminen ei kuitenkaan tarkoita samaa kuin tavallinen suppeneminen:

Esimerkki

Vuorotteleva harmoninen sarja \sum_{k=1}^{\infty}\frac{(-1)^{k+1}}{k} = 1-\frac{1}{2}+\frac{1}{3}-\frac{1}{4}+\dots suppenee, mutta ei itseisesti.

(Idea) Piirretään osasummajonon (s_n) kuvaaja, josta huomataan, että parillisten ja parittomien indeksien osasummat s_{2n} ja s_{2n+1} ovat monotonisia ja suppenevat kohti samaa raja-arvoa.


Sarjan summa on \ln 2, joka saadaan selville integroimalla geometrisen sarjan summakaavaa.

Vuorottelevan harmonisen sarjan 100 ensimmäistä osasummaa;
pisteet on yhdistetty janoilla havainnollisuuden vuoksi

Suppenemistestejä


Vertailutestit

Edelliset tarkastelut yleistyvät seuraavalla tavalla:

Lause 4.

(Majoranttiperiaate) Jos |a_k|\le p_k kaikilla k ja \sum_{k=1}^{\infty} p_k suppenee, niin myös \sum_{k=1}^{\infty} a_k suppenee.

(Minoranttiperiaate) Jos 0\le p_k \le a_k kaikilla k ja \sum p_k hajaantuu, niin myös \sum a_k hajaantuu.

Todistus.

Majorantin todistus. Koska a_k=|a_k|-(|a_k|-a_k) ja 0\le |a_k|-a_k \le 2|a_k|, niin \sum a_k on suppeneva kahden suppenevan sarjan erotuksena. Tässä käytetään aikaisempaa lausetta 2 positiivisille sarjoille; kyseessä ei ole kehäpäättely!

Minorantin todistus. Oletuksista seuraa, että sarjan \sum a_k osasummat kasvavat rajatta, joten sarja hajaantuu.
\square

Esimerkki

Tutki sarjojen 
		\sum_{k=1}^{\infty} \frac{1}{1+k^3} \ \text{ ja }\
		\sum_{k=1}^{\infty} \frac{1}{\sqrt{k}}
		suppenemista.

Ratkaisu. Koska0 kaikilla k\in \mathbb{N}, niin ensimmäinen sarja suppenee majoranttiperiaatteen nojalla.

Toisaalta \displaystyle{\frac{1}{\sqrt{k}}\ge \frac{1}{k}} kaikilla k\in\mathbb{N}, joten toisella sarjalla on hajaantuva harmoninen minorantti, joten se hajaantuu.

Suhdetesti

Käytännössä eräs parhaista tavoista tutkia suppenemista on suhdetesti, jossa sarjan peräkkäisten termien käyttäytymistä verrataan sopivaan geometriseen sarjaan:

Lause 5a.

Oletetaan, että on olemassa sellainen vakio 0< Q < 1, että 		\left| \frac{a_{k+1}}{a_k} \right| \le Q jostakin indeksistä k\ge k_0 alkaen.

Tällöin sarja \sum a_k suppenee (ja sen "suppenemisnopeus"\ on samaa luokkaa kuin geometrisella sarjalla \sum Q^k, tai jopa parempi).

Todistus.

Koska sarjan alkuosa ei vaikuta suppenemiseen (mutta se vaikuttaa  toki summaan!), niin voidaan olettaa epäyhtälön pätevän kaikilla indekseillä k.

Tästä seuraa, että |a_{k}|\le Q|a_{k-1}|\le Q^2|a_{k-2}|\le \dots\le Q^k|a_0|, joten sarjalla on geometrinen majorantti, ja se suppenee.
\square

Suhdetestin raja-arvomuoto

Lause 5b.

Oletetaan, että raja-arvo \lim_{k\to \infty}  \left| \frac{a_{k+1}}{a_k} \right| = q on olemassa. Silloin sarja \sum a_k 
		\begin{cases}\text{suppenee,} & \text{ jos } 0\le q< 1,\\
		\text{hajaantuu,} & \text{ jos } q > 1,\\
		\text{voi olla suppeneva tai haantuva,} & \text{ jos } q=1.
		\end{cases}


(Idea) Geometriselle sarjalle kahden peräkkäisen termin suhde on täsmälleen q. Suhdetestin mukaan muidenkin sarjojen suppenemista voidaan (usein) tutkia samalla periaatteella, kun suhdeluku q korvataan tällä raja-arvolla.

Todistus.

Valitaan raja-arvon määritelmässä \varepsilon =(1-q)/2>0. Silloin jostakin indeksistä k\ge k_{\varepsilon} alkaen pätee  |a_{k+1}/a_k| < q + \varepsilon = (q+1)/2 = Q < 1, ja väite seuraa lauseesta 4.


Tapauksessa q>1 sarjan yleinen termi ei lähesty nollaa, joten sarja hajaantuu.


Viimeinen tapaus q=1 ei sisällä mitään informaatiota (eikä myöskään todistettavaa).

Tämä tapaus esiintyy sekä harmonisen (a_k=1/k, hajaantuu!) että yliharmonisen (a_k=1/k^2, suppenee!) sarjan kohdalla. Näissä tapauksissa suppenemista täytyy tutkia joillakin muilla menetelmillä, kuten aikaisemmin tehtiin.
\square

Esimerkki

Onko sarja \sum_{k=1}^{\infty}\frac{(-1)^{k+1}k}{2^k}= \frac{1}{2}-\frac{2}{4}+\frac{3}{8}-\dots suppeneva?

Ratkaisu. Tässä a_k=(-1)^{k+1}k/2^k, joten 
		\left| \frac{a_{k+1}}{a_k}\right| 
		= \left| \frac{(-1)^{k+2}(k+1)/2^{k+1}}{(-1)^{k+1}k/2^k}\right|
		=\frac{k+1}{2k} =\frac{1}{2}+\frac{1}{2k}\to \frac{1}{2} < 1,
		kun k\to\infty. Suhdetestin perusteella sarja suppenee.

'); }],{ useMathJax : true, fontSize : 14, visible : false }); /*var txt2 = board.create('text', [15, 1.8, function() { return 'k=' + (series.dataX.length-1) + ': value = ' + series.dataY[series.dataY.length - 1]; }], {strokeColor: 'black'});*/ var TO; var approx = function() { series_add(); board.update(); if (series.dataX.length <= 50) { TO = setTimeout(approx, 500); } }; var a_k; var start_approx = function() { txt.setAttribute( { visible : true }); board.removeObject(dataPoints); dataPoints = []; series.dataX = []; series.dataY = []; var txtraw = document.getElementById('input').value; a_k = board.jc.snippet(txtraw, true, 'k', true); k = parseInt(document.getElementById('startval').value); start = k; approx(); } var clear_all = function() { clearTimeout(TO); }; document.getElementById('startSeq').onclick = start_approx; document.getElementById('stopSeq').onclick = clear_all; })();

3. Jatkuvuus

Sisältö

  • Funktion raja-arvo
  • Raja-arvo ja jatkuvuus
  • Jatkuvien funktioiden ominaisuuksia

Tässä luvussa määritellään funktion f\colon S\to \mathbb{R} raja-arvo pisteessä x_0. Oletamme, että lukija tuntee ennestään reaalimuuttujan funktion käsitteen ja lukujonon raja-arvon.

Funktion raja-arvo


Olkoon S reaalilukujen osajoukko ja x_0 sellainen piste, että on olemassa jono pisteitä (x_k)\in S\setminus \{x_0\}, joille x_k\to x_0, kun k\to \infty. Usein S on kaikkien reaalilukujen joukko, mutta toisinaan myös väli (avoin, puoliavoin tai suljettu).

Esimerkki 1.

Pisteen x_0 ei tarvitse kuulua joukkoon S. Esimerkiksi jono x_k = 1/k\to 0 joukossa S=\, ]0,2[, kun k\to \infty, ja x_k\in S kaikilla k=1,2,\ldots, mutta 0 ei kuulu joukkoon S.

Funktion raja-arvo

Funktion f\colon S\to \mathbb{R} raja-arvo pisteessä x_0 määritellään seuraavalla tavalla.

Määritelmä 1: Funktion raja-arvo

Olkoon S\subset \mathbb{R} ja f\colon S\to \mathbb{R} funktio. Sanotaan, että funktiolla f on raja-arvo y_{0} pisteessä x_{0}, merkitään \lim_{x \to x_{0}}f(x)=y_{0}, jos f(x_{k})\to y_{0}, kun k\to \infty kaikille niille jonoille (x_{k}) joukossa S\setminus\{x_0\}, joille x_{k}\to x_{0}, kun  k\to \infty.

Esimerkki 2.

Functiolla f\colon \mathbb{R} \to \mathbb{R}, f(x)=x^2, on raja-arvo 0 pisteessä x_0=0.

Funktio y=x^2.

Esimerkki 3.

Funktiolla g\colon\mathbb{R}\to \mathbb{R}, g(x)= \left\{\begin{array}{rl}0, & \text{ kun }x ei ole raja-arvoa pisteessä x_0=0. Tämän todistamiseksi määritellään jonot (x_k), (y_k) asettamalla x_k=1/k ja y_k=-1/k, kun k=1,2,\ldots. Silloin molemmat jonot sisältyvät joukkoon S=\mathbb{R}\setminus \{ 0\} ja niillä on raja-arvona tutkittava piste x_0=0. Kuitenkin f(x_k)=1 ja f(y_k)=0 kaikilla k, joten funktion arvoista muodostetuilla jonoilla on eri raja-arvot.

Funktio g(x)= \left\{\begin{array}{rl}0, & \text{ kun }x

Esimerkki 4.

Funktiolla f(x)=x \sin(1/x), x>0, on raja-arvo 0 pisteessä 0.

Funktio y=x\sin(1/x) arvoilla x>0.

Esimerkki 5.

Funktiolla g(x)= \sin(1/x), x>0, ei ole raja-arvoa pisteessä 0.

Funktio y=\sin(1/x) arvoilla x>0.

Toispuoleiset raja-arvot

Raja-arvon tärkeä ominaisuus on sen yksikäsitteisyys. Tämä tarkoittaa sitä, että tapauksessa \lim_{x\to x_0} f(x)=a ja \lim_{x\to x_0} f(x)=b täytyy olla a=b. Tästä huolimatta voi usein olla hyödyllistä tutkia funktion käyttäytymistä, kun x_k lähestyy tutkittavaa pistettä x_0 vain vasemmalta tai oikealta. Näitä kutsutaan funktion f vasemman- tai oikeanpuoleisiksi raja-arvoiksi pisteessä x_0.

Määritelmä 2: Toispuoleiset raja-arvot

Olkoon S\subset \mathbb{R} ja f funktio, joka on määritelty (ainakin) joukossa S\setminus\{x_0\}. Tällöin funktiolla f has a vasemmanpuoleinen raja-arvo y_{0} pisteessä x_{0}, merkitään \lim_{x \to x_{0}-}f(x)=y_{0}, jos f(x_{k})\to y_{0}, kun k\to \infty kaikille niille jonoille (x_{k}) joukossa  S\cap ]-\infty,x_0[ =\{ x\in S : x < x_0 \}, joille x_{k}\to x_{0}, kun k\to \infty.

Vastaavasti funktiolla f on oikeanpuoleinen raja-arvo y_{0} pisteessä x_{0}, merkitään \lim_{x \to x_{0}+}f(x)=y_{0},, jos f(x_{k})\to y_{0}, kun k\to \infty kaikille niille jonoille (x_{k}) joukossa S\cap ]x_0,\infty[ =\{ x\in S : x_0 < x \}, joille x_{k}\to x_{0}, kun k\to \infty.

Lause 1: Funktion raja-arvo

Funktiolla f\colon S\to \mathbb{R} on raja-arvo y_0 pisteessä x_0 täsmälleen silloin, kun \lim_{x \to x_{0}-}f(x)= \lim_{x \to x_{0}+}f(x)=y_{0}.

Esimerkki 6.

Signum-funktio \mathrm{sgn}(x)= \frac{x}{|x|} on määritelty joukossa S= \mathbb{R}\setminus 0. Pisteessä 0 sen vasemman- ja oikeanpuoleiset raja-arvot ovat \lim_{x\to 0-} \mathrm{sgn}(x)= -1,\qquad
	\lim_{x\to 0+} \mathrm{sgn}(x)= 1. Funktiolla \mathrm{sgn}(x) ei siis ole raja-arvoa 0.

Funktio y = \frac{x}{|x|}.

Esimerkki 7.

Funktiolla f: \mathbb{R}\setminus 0 \to \mathbb{R} f(x) = \frac{1}{x} ei ole toispuoleisia raja-arvoja pisteessä 0.

Laskusääntöjä

Raja-arvojen laskusäännöt seuraavat suoraan vastaavista lukujonojen raja-arvon ominaisuuksista.

Lause 2: Raja-arvon laskusääntöjä

Olkoon c\in \mathbb{R}, \lim_{x\to x_{0}} f(x)=a ja \lim_{x\to x_{0}} g(x)=b. Tällöin

  1. \lim_{x\to x_{0}} (cf)(x)=ca,
  2. \lim_{x\to x_{0}} (f+g)(x)=a+b,
  3. \lim_{x\to x_{0}} (fg)(x)=ab,
  4. \lim_{x\to x_{0}} (f/g)(x)=a/b,  (\text{ jos }  b \neq 0).
Esimerkki 8.

Helpoimmissa tapauksissa raja-arvo saadaan laskemalla f(x_0):

a) \lim_{x\to 2}(5x-3)=10-3=7.

b) \lim_{x\to -2}\frac{3x+2}{x+5} = \frac{-6+2}{-2+5}=-\frac{4}{3}.

c) \lim_{x\to 2} \frac{x^2-4}{x-2} = \lim_{x\to 2} \frac{(x+2)(x-2)}{x-2} = \lim_{x\to 2}(x+2) = 4.

Raja-arvot ja jatkuvuus


Tässä kappaleessa määritellään funktion jatkuvuus. Jatkuvuuden intuitiivinen tulkinta on se, että funktion kuvaaja on yhtenäinen viiva. Tämä ei kuitenkaan ole matemaattisesti riittävän tarkka määritelmä, koska se mm. sisältää epämääräisiä (?) käsitteitä kuten "yhtenäinen" ja "viiva". Tämän perusteella voi esimerkiksi olla vaikea päättää, onko funktio \tan(x) jatkuva vai ei.

Funktion f jatkuvuuteen pisteessä x_0 vaaditaan, että:

  1. f(x_0) on määritelty,

  2. \lim_{x \to x_0} f(x) on olemassa (ja äärellinen),

  3. \lim_{x \to x_0} f(x) = f(x_0).

Toisin sanoen:

Määritelmä 2: Jatkuvuus

Funktio f\colon S\to \mathbb{R} on jatkuva pisteessä x_{0}\in S, jos \lim_{x\to x_{0}}f(x)=f(x_{0}). Funktio f\colon S\to \mathbb{R} on jatkuva, jos se on jatkuva jokaisessa pisteessä x_{0}\in S.

Esimerkki 1.

Olkoon c\in \mathbb{R}. Funktiot f,g,h, jotka on määritelty kaavoilla f(x)=c, g(x)=x, h(x)=|x|, ovat jatkuvia kaikissa pisteissä x\in \mathbb{R}.

Miksi? Jos x_{k}\to x_{0}, niin f(x_{k})=c ja \lim_{k\to \infty}f(x_k)= c=f(x_{0}). Vastaavasti funktiolle g pätee g(x_{k})=x_{k} ja sen vuoksi \lim_{k\to\infty} g(x_k)=x_{0}=g(x_{0}). Samoin h(x_{k})=|x_{k}| ja \lim_{k\to\infty}h(x_k)= |x_{0}|=h(x_{0}).

Jatkuvat funktiot y=c, y=x and y=|x|.

Esimerkki 2.

Olkoon x_{0}\in \mathbb{R}. Määritellään funktio f\colon\mathbb{R}\to \mathbb{R} asettamalla f(x)= \left\{\begin{array}{rl}2, & \text{ kun }x \lt x_{0}, \\
		3, & \text{ kun } x\geq x_{0}.\end{array}\right. Silloin \lim_{x \to x_{0}^{-}}f(x)=2,\text{ ja } \lim_{x \to x_{0}^{+}}f(x)=3. Tämän vuoksi f ei ole jatkuva pisteessä x_{0}.

Seuraavaksi esitellään joitakin jatkuvien funktioiden perusominaisuuksia. Raja-arvosääntöjen avulla (Lause 2) saadaan:

Lause 3.

Jatkuvien funktioiden summa ja tulo ovat jatkuvia. Erityisesti polynomit ovat jatkuvia funktioita. Jos f ja g ovat jatkuvia ja g(x_{0})\neq 0, niin f/g on jatkuva pisteessä x_{0}.

Jatkuvien funktioiden yhdistetty funktio on jatkuva, kunhan se on määritelty:

Lause 4.

Olkoot f\colon \mathbb{R}\to\mathbb{R} ja g\colon \mathbb{R}\to \mathbb{R}. Oletetaan, että f on jatkuva pisteessä x_{0} ja g on jatkuva pisteessä f(x_{0}). Tällöin g\circ f\colon \mathbb{R}\to \mathbb{R} on jatkuva pisteessä x_{0}.

Todistus.

Huom. Jos f on jatkuva, niin |f| on jatkuva.

Miksi?

Merkitään g(x):=|x|. Silloin (g\circ f)(x)=|f(x)|.

Huom. Jos f and g ovat jatkuvia, niin \max (f,g) ja \min (f,g) ovat jatkuvia. (Tässä \max (f,g)(x):=\max \{f(x),g(x)\}.)

Miksi?

Käytetään kaavoja \begin{cases}(a+b)+|a-b|=2\max(a,b), \\
		(a+b)-|a-b|=2\min(a,b). \end{cases}

\text{Funktio }f(x)= \left\{\begin{array}{rl}2, & \text{ kun }x\lt x_{0}, \\
		3, & \text{ kun }x\geq x_{0}. \end{array}\right.

'}], { strokeColor : colors[0], fontSize : 16, visible : true }); l[1] = board.create('text', [-4, 3, function() { return 'y=x'}], { strokeColor : colors[1], fontSize : 16, visible : false }); l[2] = board.create('text', [-4, 3, function() { return 'y=|x|'}], { strokeColor : colors[2], fontSize : 16, visible : false }); g[0] = board.create('functiongraph', [f0, -6, 6], { visible : true, strokeWidth : 1.5, strokeColor : colors[0], highlight : false }); g[1] = board.create('functiongraph', [f1, -6, 6], { visible : false, strokeWidth : 1.5, strokeColor : colors[1], highlight : false }); g[2] = board.create('functiongraph', [f2, -6, 6], { visible : false, strokeWidth : 1.5, strokeColor : colors[2], highlight : false }); var currentGraph = g[0]; var currentLabel = l[0]; select.on('drag', function() { currentGraph.setAttribute({ visible : false }); currentLabel.setAttribute({ visible : false }); currentGraph = g[select.Value()]; currentLabel = l[select.Value()]; currentGraph.setAttribute({ visible : true }); currentLabel.setAttribute({ visible : true, useMathJax : true }); select.setAttribute({ fillColor : colors[select.Value()] }); board.update(); }); board.fullUpdate(); })(); /* Example 2. */ (function() { var board = JXG.JSXGraph.initBoard('jxgbox16', { boundingbox : [-3.5, 4.5, 3.5, -1.25], showcopyright : false, shownavigation : false}); var xaxis = board.create('axis', [[0, 0], [1, 0]]); xaxis.removeAllTicks(); var yaxis = board.create('axis', [[0, 0], [0, 1]], { drawZero : true, ticks : { majorHeight : 5, minorTicks : 0, ticksDistance : 1.0 } }); yaxis.defaultTicks.ticksFunction = function() { return 1; }; var xtick = board.create('segment', [[1, .05],[1, -.1]], { strokeWidth : 1, strokeColor : 'black', strokeOpacity : .4, highlight : false }); var f = function(x) { return 2; } var g = function(x) { return 3; } board.create('functiongraph', [f, -3.5, 1], { strokeColor : 'black', strokeWidth : 2, highlight : false }); board.create('functiongraph', [g, 1, 3.5], { strokeColor : 'black', strokeWidth : 2, highlight : false }); board.create('point', [1, f(1)], { name : '', fillColor : 'white', strokeColor : 'black', strokeWidth : .5, size : 2, fixed : true, showInfobox : false }); board.create('point', [1, g(1)], { name : '', fillColor : 'black', strokeColor : 'black', strokeWidth : .5, size : 2, fixed : true, showInfobox : false }); var x0 = board.create('text', [1, 0, function() { return 'x_{0}'; }], { useMathJax : true }); board.fullUpdate(); })();

Epsilon-delta määritelmä

Seuraavaksi esitetään jatkuvuuden (\varepsilon,\delta)-määritelmä. Tärkein idea on se, että jos f on jatkuva pisteessä x_0, niin funktion arvojen f(x) pitäisi lähestyä arvoa f(x_0), kun x lähestyy pistettä x_0.

Tämä määritelmä yleistyy muillekin kuin tällä kurssilla käsitellyille reaalifunktioille.

Lause 5: (\varepsilon,\delta)-määritelmä

Olkoon f: S\to \mathbb{R}. Tällöin seuraavat ehdot ovat yhtäpitäviä:

  1. \lim_{x\to x_0} f(x)= y_0,
  2. Jokaista \varepsilon> 0 vastaa sellainen \delta >0, että ehdoista x\in S ja 0 < |x-x_0| < \delta seuraa epäyhtälö |f(x) - y_0| .

Todistus.

Esimerkki 3.

Lauseen 3 perusteella tiedämme, että funktio f: \mathbb{R} \to \mathbb{R}, f(x) = 4x, on jatkuva. Tämä voidaan perustella myös käyttämällä (\varepsilon,\delta)-määritelmää.

Todistus. Olkoon x_0 \in \mathbb{R} ja \varepsilon > 0. Tällöin |f(x) - f(x_0)| = |4x - 4x_0| = 4|x - x_0| < \varepsilon, jos |x - x_0| < \delta \text{ ja valitaan } \delta = \frac{\varepsilon}{4}.

Jokaista \varepsilon > 0 vastaa siis sellainen \delta > 0, että ehdosta |x - x_0| < \delta seuraa |f(x) - f(x_0)| < \varepsilon. Lauseen 5 mukaan \lim_{x \to x_0} f(x) = f(x_0) kaikilla x_0 \in \mathbb{R} ja määritelmän mukaan tämä tarkoittaa funktion f: \mathbb{R} \to \mathbb{R} jatkuvuutta.
\square

Kokeile: (\varepsilon, \delta) esimerkissä 3.

'} ], { strokeColor : 'black', fontSize : 12, fixed : true }) var s = board.create('slider', [[-3, 1], [-1.25, 1], [0.05, 2, 2]], { name : '\\varepsilon', unitLabel : '', fillColor : '#bd4444', snapWidth : 0.01, label : { useMathJax : true, strokeColor : '#bd4444', offset : [0, 25] }}); var x1 = board.create('glider', [1/2, 0, xaxis], { name: 'x_{0}', strokeColor : 'black', strokeWidth : .5, fillColor : '#446abd', showinfobox : false, label : { useMathJax : true, strokeColor : '#446abd', offset : [5, 25] } }); /*board.suspendUpdate();*/ var y1 = board.create('point', [0, function(){return f(x1.X());}], { name : 'f(x_{0})', size : 2, strokeColor : 'black', strokeWidth : .5, fillColor : '#bd4444', showinfobox : false, highlight : false, label : { useMathJax : true, strokeColor : '#bd4444', offset : [5, 25] }}); var y2 = board.create('point', [0, function(){return f(x1.X())-s.Value();}], { visible : false }); var y3 = board.create('point', [0, function(){return f(x1.X())+s.Value();}], { visible : false }); var z1 = board.create('point', [function(){return y1.Y()/4;}, function(){return y1.Y();}], { visible : false }); var z2 = board.create('point', [function(){return y2.Y()/4;}, function(){return y2.Y();}], { visible : false }); var z3 = board.create('point', [function(){return y3.Y()/4;}, function(){return y3.Y();}], { visible : false }); var v1 = board.create('segment', [z1, y1], { strokeColor : '#bd4444', strokeWidth : 1, highlight : false }); var v2 = board.create('line', [z2, y2], { strokeColor : '#bd4444', dash : 2, strokeWidth : 1, highlight : false }); var v3 = board.create('line', [z3, y3], { strokeColor: '#bd4444', dash : 2, strokeWidth : 1, highlight : false }); var epsilon = board.create('polygon', [function() { return [-.5, y2.Y()]; }, function() { return [2.5, y2.Y()]; }, function() { return [2.5, y3.Y()]; }, function() { return [-.5, y3.Y()]; }], { fillColor : '#bd4444', fillOpacity : .3, highlight : false, vertices : { visible : false }, borders : { visible : false }}); var h1 = board.create('segment', [function() { return x1; }, function() { return z1; }], { strokeColor : '#446abd', strokeWidth : 1, highlight : false }); var h2 = board.create('segment', [function() { return [z2.X(), 0]; }, function() { return [z2.X(), 8]}], { strokeColor : '#446abd', dash : 2, strokeWidth : 1, highlight : false }); var h3 = board.create('segment', [function() { return [z3.X(), 0]; }, function() { return [z3.X(), 8]}], { strokeColor : '#446abd', dash : 2, strokeWidth : 1, highlight : false }); var delta = board.create('polygon', [h2.point1, h2.point2, h3.point2, h3.point1], { fillColor : '#446abd', fillOpacity : .3, highlight : false, vertices : { visible : false }, borders : { visible : false }}); var txt = board.create('text', [-2.5, .7, function() { return '\\delta = \\epsilon/4 = ' + (s.Value()/4).toFixed(3) + ''; }], { strokeColor : '#446abd', useMathJax : true, fixed : true }); /*board.unsuspendUpdate();*/ board.fullUpdate(); })();
Esimerkki 4.

Olkoon x_{0}\in \mathbb{R}. Määritellään funktio f\colon\mathbb{R}\to \mathbb{R} asettamalla f(x)= \left\{\begin{array}{rl}2, & \text{ jos }x \lt x_{0}, \\
		3, & \text{ jos }x \geq x_{0}.\end{array}\right. Esimerkissä 2 nähtiin, että tämä funktio on epäjatkuva pisteessä x_0. Tämän todistamiseksi (\varepsilon,\delta)-määritelmää käyttämällä täytyy löytää sellainen \varepsilon > 0 ja x_\delta \in \mathbb{R}, että kaikilla \delta > 0 on voimassa |x_\delta - x_0| < \delta, mutta |f(x_\delta) - f(x_0)| > \varepsilon.

Todistus. Olkoon \delta > 0 ja \varepsilon = 1/2. Valitsemalla x_\delta = x_0 - \delta /2 on voimassa 0 < |x_\delta-x_0| = |x_0 - \frac{\delta}{2} + x_0| = \frac{\delta}{2} < \delta, ja |f(x_\delta) - f(x_0)| = |2 - 3| = 1 > \varepsilon. Näin ollen Lauseen 5 perusteella f ei ole jatkuva pisteessä x_{0}.
\square

Kokeile: (\varepsilon, \delta) esimerkissä 4.

', fillColor : '#446abd', label : { useMathJax : true, strokeColor : '#446abd' }}); var x1 = board.create('glider', [0, 0, xaxis], { name:'x_{0}', strokeWidth : .3, strokeColor : 'black', fillColor : '#446abd', showinfobox : false, highlight : false, fixed : true, label : { useMathJax : true, offset : [5, 25], strokeColor : '#446abd' }}); board.suspendUpdate(); var x2 = board.create('point', [ function(){return x1.X()-s.Value();}, 0], { visible : false }); var x3 = board.create('point', [function(){return x1.X()+s.Value();},0], { visible : false }); var y1 = board.create('point', [-2, function() { return f(x1.X()); }], { size : 2, name: 'f(x_{0})', strokeWidth : .3, strokeColor : 'black', fillColor : '#446abd', showinfobox : false, highlight : false, label : { useMathJax : true, offset : [5, 25], strokeColor : '#446abd' } }); var yd = board.create('point', [-2, function() { return f(x2.X()); }], { size : 2, name: 'f(x_{\\delta})', strokeWidth : .3, strokeColor : 'black', fillColor : '#bd4444', showinfobox : false, highlight : false, label : { useMathJax : true, offset : [5, 25], strokeColor : '#bd4444' } }); /* doesn't really do anything atm... */ var dist = function() { if (Math.abs(f(x1)-f(x2.X())) != 0 || Math.abs(f(x1)-f(x3.X())) != 0) { return .5; } else { return 0; } }; var y2 = board.create('point', [0, function() { return y1.Y()-dist(); }], { visible : false }); var y3 = board.create('point', [0, function() { return y1.Y()+dist(); }], { visible : false }); var endpoint1 = board.create('point', [0, 2], { name : '', fixed : true, size : 2, fillColor : 'white', strokeWidth : .5, strokeColor : 'black', showinfobox : false }); var endpoint2 = board.create('point', [0, 3], { name : '', fixed : true, size : 2, fillColor : 'black', strokeWidth : .5, strokeColor : 'black', showinfobox : false }); var v1 = board.create('segment', [x1, function() { return [x1.X(), y1.Y()]; }], { strokeColor : '#446abd', strokeWidth : 1, highlight : false }); var v2 = board.create('line', [x2, function() { return [x2.X(), x2.Y()+1]; }], { strokeColor : '#446abd', dash : 2, strokeWidth : 1, highlight : false }); var v3 = board.create('line', [x3, function() { return [x3.X(), x3.Y()+1]; }], { strokeColor : '#446abd', dash : 2, strokeWidth : 1, highlight : false }); var delta = board.create('polygon', [function() { return [x2.X(), -5]; }, function() { return [x2.X(), 6]; }, function() { return [x3.X(), 6]; }, function() { return [x3.X(), -5]; }], { highlight : false, fixed : true, vertices : { visible : false }, borders : { visible : false }, fillColor : '#446abd', fillOpacity : .2 }); var h1 = board.create('segment', [y1, function() { return [x1.X(), y1.Y()]; }], { strokeColor : '#446abd', strokeWidth : 1, highlight : false }); var h2 = board.create('line', [function() { return y2; }, function() { return [y2.X()+1, y2.Y()]; }], { strokeColor : '#bd4444', dash : 2, strokeWidth : 1, highlight : false }); var h3 = board.create('line', [function() { return y3; }, function() { return [y3.X()+1, y3.Y()]; }], { strokeColor : '#bd4444', dash : 2, strokeWidth : 1, highlight : false }); var epsilon = board.create('polygon', [[-5, 3.5],[10, 3.5],[10, 2.5], [-5, 2.5]], { highlight : false, fixed : true, vertices : { visible : false }, borders : { visible : false }, fillColor : '#bd4444', fillOpacity : .2 }); var txt = board.create('text', [4.2, -1.5, function() { return '\\epsilon = 1/2'/*Math.max(Math.abs(y2.Y() - y1.Y()), Math.abs(y1.Y() - y3.Y())).toFixed(2)*/; }], { strokeColor: '#bd4444', useMathJax : true, fixed : true }); board.unsuspendUpdate(); board.fullUpdate(); })();

Jatkuvien funktioiden ominaisuuksia


Tässä kappaleessa tutustutaan jatkuvien funktioiden tärkeimpiin ominaisuuksiin. Aloitamme jatkuvien funktioiden väliarvolauseella, joka tunnetaan myös nimellä Bolzanon lause. Tämän lauseen erään muotoilun mukaan jatkuva funktio saa kaikki arvot sen maksimin ja minimin väliltä. Intuitiivinen perustelu on se, että jatkuvan funtion kuvaaja on yhtenäinen viiva.

Lause 6: Jatkuvien funktioiden väliarvolause

Jos f\colon [a,b]\to \mathbb{R} on jatkuva ja f(a) \lt s \lt f(b), niin on olemassa aiankin yksi sellainen piste c\in\, ]a,b[, että f(c)=s.

Todistus.

Kokeile siirtämällä katkoviivan korkeutta: Lause 6.

Väliarvolause.

Esimerkki 1.

Määritellään funktio f:\mathbb{R} \to \mathbb{R} kaavalla f(x) = x^5 - 3x - 1. Osoita, että on sillä on ainakin yksi nollakohta eli piste c \in \mathbb{R}, jolle f(c) = 0.

Ratkaisu. Polynomifunktiona f on jatkuva. Lisäksi f(1) = 1^5 - 3 \cdot 1 - 1 = -3 < 0 ja f(-1) = (-1)^5 - 3 \cdot (-1) - 1 = 1 > 0, joten väliarvolauseen nojalla on olemassa sellainen c \in\, ]-1, 1[, että f(c) = 0.

Funktio f(x) = x^5 - 3x - 1.

Esimerkki 2 (kummallinen?).

Olkoon f(x)=x^3-x=x(x^2-1)=x(x+1)(x-1).

By the Intermediate Value Theorem we have f(x) for x or 0 \lt x \lt 1. Similarly, f(x)>0 for -1 \lt x \lt 0 or 1 \lt x, because:

  1. f(x)=0 if and only if x=0 or x=\pm 1, and
  2. f(-2)0, f(1/2) and f(2)>0.

Funktio f(x) = x^3 - x.

'; }], { anchor : l, strokeColor : 'red', fontSize : 13, fixed : true }); var fleft = board.create('text', [.2, 4.4, function() { return 'f(a)'}], { strokeColor : 'black', fontSize : 13, fixed : true }); var fright = board.create('text', [9.1, 7.6, function() { return 'f(b)'}], { strokeColor : 'black', fontSize : 13, fixed : true }); var xleft = board.create('text', [1.1, -.1, function() { return 'a' }], { strokeColor : 'black', fontSize : 13, fixed : true }); var xright = board.create('text', [9.1, -.1, function() { return 'b' }], { strokeColor : 'black', fontSize : 13, fixed : true }); l.on('drag', function() { if(l.point1.Y() >= 7) { l.point1.moveTo([0, 7]); l.point2.moveTo([1, 7]); } else if(l.point1.Y() <= 4) { l.point1.moveTo([0, 4]); l.point2.moveTo([1, 4]); } }); var intersections = []; intersections[0] = board.create('intersection', [l, g, 0], { name : 'f(c)=s', showinfobox : false, label : { fontSize : 13, offset : [0, -15], strokeColor : 'blue', strokeWidth : .5} }); intersections[1] = board.create('intersection', [l, g, 1], { name : 'f(c)=s', showinfobox : false, label : { fontSize : 13, offset : [8, 22], strokeColor : 'blue', strokeWidth : .5} }); intersections[2] = board.create('intersection', [l, g, 2], { name : 'f(c)=s', showinfobox : false, label : { fontSize : 13, offset : [0, -15], strokeColor : 'blue', strokeWidth : .5} }); board.unsuspendUpdate(); })(); /* Example 1. */ (function() { var board = JXG.JSXGraph.initBoard('jxgbox17', { boundingbox : [-3.5, 2.5, 3.5, -3.5], showcopyright : false, shownavigation : false}); var xaxis = board.create('axis', [[0, 0], [1, 0]], { ticks : { majorHeight : 7, minorTicks : 0, drawZero : true } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { ticks : { majorHeight : 7, minorTicks : 0, drawZero : true } }); xaxis.defaultTicks.ticksFunction = function() { return 1; }; yaxis.defaultTicks.ticksFunction = function() { return 1; }; var f = function(x) { return (Math.pow(x,5)-3*x-1); } board.create('functiongraph', [f, -3.5, 3.5], { strokeColor : 'black', strokeWidth : 2, highlight : false }); board.fullUpdate(); })(); /* Example 2. */ (function() { var board = JXG.JSXGraph.initBoard('jxgbox18', { boundingbox : [-3.2, 2.9, 3.2, -2.9], showcopyright : false, shownavigation : false}); var xaxis = board.create('axis', [[0, 0], [1, 0]], { ticks : { majorHeight : 7, minorTicks : 0, drawZero : true } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { ticks : { majorHeight : 7, minorTicks : 0, drawZero : true } }); xaxis.defaultTicks.ticksFunction = function() { return 1; }; yaxis.defaultTicks.ticksFunction = function() { return 1; }; var f = function(x) { return (x*x*x-x); } board.create('functiongraph', [f, -3.2, -1], { strokeColor : 'blue', strokeWidth : 2, highlight : false }); board.create('functiongraph', [f, -1, 0], { strokeColor : 'red', strokeWidth : 2, highlight : false }); board.create('functiongraph', [f, 0, 1], { strokeColor : 'blue', strokeWidth : 2, highlight : false }); board.create('functiongraph', [f, 1, 3.2], { strokeColor : 'red', strokeWidth : 2, highlight : false }); board.fullUpdate(); })();

Seuraavaksi osoitetaan, että suljetulla välillä jatkuva funktio on rajoitettu. Tässä on tärkeää, että kyseessä on nimenomaan suljettu väli. Lauseen jälkeinen esimerkki osoittaa, ettei väite pidä paikkaansa avoimille väleille.

Lause 7.

Olkoon f\colon [a,b]\to \mathbb{R} jatkuva. Silloin f on rajoitettu, ts. on olemassa sellainen vakio C, että |f(x)|\le C kaikilla x\in [a,b].

Todistus.

Huom. Jos f\colon ]a,b[\to \mathbb{R} on jatkuva, niin se ei välttämättä ole rajoitettu.

Esimerkki 4.

Olkoon f\colon ]0,1]\to \mathbb{R}, f(x)=1/x. Nyt \lim_{x\to 0+}f(x)=\infty.

Lause 8.

Olkoon f\colon [a,b]\to \mathbb{R} jatkuva. Silloin on olemassa pisteet c,d\in [a,b], joille f(c)\leq f(x)\leq f(d) kaikilla x\in [a,b], ts. f(c) on funktion pienen arvo eli minimi ja f(d) sen suurin arvo eli maksimi välillä [a,b].

Todistus.

Funktio f(x) = 1/x alueessa x > 0.

Esimerkki 5.

Olkoon f\colon [-1,2] \to \mathbb{R}, f(x) = -x^3 - x + 3. Funktion määrittelyjoukko on [-1,2]. Funktion arvojoukon määrittämiseksi osoitetaan ensin, että funktio on vähenevä.

Olkoon x_1 < x_2. Silloin x_{1}^3 < x_{2}^3 ja -x_{1}^3 > -x_{2}^3.

Koska x_1 < x_2, niin -x_1^3-x_1 > -x_2^3 -x_2 ja -x_1^3-x_1 +3 > -x_2^3 -x_2 +3. Näin ollen oletuksesta x_1 < x_2 seuraa f(x_1) > f(x_2), joten funktio f on vahenevä.

Vähenevän funktion minimiarvo on välin päätepisteessä. Näin ollen funktion f:[-1,2] \to \mathbb{R} minimi on f(2) = -2^3 - 2 + 3 = -7. Vastaavasti suurin arvo on väli alkupisteessä, joten funktion f:[-1,2] \to \mathbb{R} maksimi on f(-1) = -(-1)^3 - (-1) + 3 = 5.

Polynomina funktio f on jatkuva, joten se saa kaikki arvot maksimin ja minimin välillä. Näin ollen funktion f arvojoukko on [-7, 5].

Funktio -x^3 - x + 3 välillä [-1, 2].

Esimerkki 6.

Olkoon f polynomi. Silloin f on jatkuva joukossa \mathbb{R} ja lauseen 7 nojalla myös rajoitettu jokaisella suljetulla välillä [a,b], kun a \lt b. Lauseen 3 perusteella funktiolla f on maksimi ja minimi  [a,b].

Huom. Lause 8 liittyy väliarvolauseeseen seuraavalla tavalla:

Jos f\colon [a,b]\to \mathbb{R} on jatkuva, niin on olemassa pisteet x_1,x_2\in [a,b], joille funktion arvojoukko on muotoa f([a,b])=[f(x_1),f(x_2)].

4. Derivaatta

Sisältö

Derivaatta


Tässä luvussa käsitellään derivaattaa ja sen ominaisuuksia. Aloitetaan esimerkillä, joka johdattelee derivaatan määritelmää.

Esimerkki 0.

Alla oleva kuvaaja kertoo, kuinka kauaksi pyöräilijä on edennyt lähtöpisteestään.


a) Tarkastellaan punaista viivaa. Huomataan, että kolmen tunnin aikana pyöräilijä on edennyt 20 km. Hänen keskinopeutensa on 6{,}7 km/h.
b) Tarkastellaan sitten vihreää viivaa. Huomataan, että kolmannen tunnin aikana pyöräilijä on edennyt 10 km. Tällä aikavälillä hänen keskinopeutensa on siis 10 km/h.
 Huomaa, että punaisen viivan kulmakerroin on 20/3 \approx 6{,}7 ja vihreän viivan kulmakerroin on 10. Lukuarvot ovat samat kuin vastaavat keskinopeudet.
c) Tarkastellaan vielä sinistä viivaa. Se on kuvaajan tangentti kohdassa x=2 h. Kuten keskinopeuksien kohdalla, voidaan päätellä, että kaksi tuntia lähdön jälkeen pyöräilijän nopeus oli 30/2 km/h = 15 km/h.

Siirrytään sitten yleiseen määritelmään:

Määritelmä: Derivaatta

Olkoon  (a,b)\subset \mathbb{R}. Funktion f\colon (a,b)\to \mathbb{R} derivaatta pisteessä x_0\in (a,b) on f'(x_0):=\lim_{h\to 0} \frac{f(x_0+h)-f(x_0)}{h}. Jos f'(x_0) on olemassa, niin f on derivoituva pisteessä x_0.

Huom: Koska x = x_0+h, niin h=x-x_0, joten määritelmä voidaan kirjoittaa myös muodossa f'(x_0):=\lim_{x\to x_0} \frac{f(x)-f(x_0)}{x-x_0}.

Derivaatalle käytetään erilaisia merkintöjä:  f'(x_0)=Df(x_0) =\left. \frac{df}{dx}\right|_{x=x_0}, \ \ f'=Df =\frac{df}{dx}.

Tulkinta. Tarkastellaan käyrää y = f(x). Jos piirretään suora viiva pisteiden (x_0,f(x_0)) ja (x_0+h, f(x_0+h)) kautta, niin tämän suoran kulmakerroin on \frac{f(x_0+h)-f(x_0)}{x_0+h-x_0} = \frac{f(x_0+h)-f(x_0)}{h}. Kun h \to 0, tämä suora sivuaa käyrää y = f(x) pisteessä (x_0, f(x_0)). Tämä suora on käyrän y=f(x) tangentti pisteessä (x_0,f(x_0)) ja sen kulmakerroin on \lim_{h\to 0} \frac{f(x_0+h)-f(x_0)}{h}, joka on funktion f derivaatta pisteessä  x_0. Tangentin yhtälö on siis muotoa y=f(x_0)+f'(x_0)(x-x_0).

Kokeile. Tutki tangentin muuttumista siirtämällä sivuamispistettä.

Esimerkki 1.

Olkoon f\colon \mathbb{R} \to \mathbb{R} määritelty kaavalla f(x) = x^3 + 1. Funktion f derivaatta pisteessä x_0 = 1 on \begin{aligned}f'(1) &=\lim_{h \to 0} \frac{f(1+h)-f(1)}{h} \\ &=\lim_{h \to 0} \frac{(1+h)^3 + 1 - 1^3 - 1}{h} \\ &=\lim_{h \to 0} \frac{1+3h+3h^2+h^3-1}{h} \\ &=\lim_{h \to 0} \frac{h(3+3h+h^2)}{h} \\ &=\lim_{h \to 0} 3+3h+h^2 \\ &= 3. \end{aligned}

Funktion  f(x)=x^3 + 1 kuvaaja ja sen tangentti pisteessä (1,2).

Esimerkki 2.

Olkoon f\colon \mathbb{R} \to \mathbb{R}, f(x)=ax+b. Lasketaan funktion f derivaatta.

Määritelmän mukaan saadaan: \begin{aligned}f'(x) &=\lim_{h\to 0} \frac{f(x+h)-f(x)}{h} \\ &=\lim_{h\to 0} \frac{[a(x+h)+b]-[ax+b]}{h} \\ &=\lim_{h\to 0} a \\ &=a.\end{aligned}

Tässä a on tangentin kulmakerroin kaikissa pisteissä. Huomaa, ettei se riipu muuttujasta x, koska y=ax+b on suoran yhtälö.

Huom. Kun a=0, niin f(x) = b ja f'(x) = 0. Vakiofunktion derivaatta on siis nolla.

Esimerkki 3.

Olkoon g\colon \mathbb{R} \to \mathbb{R}, g(x)=|x|. Onko g derivoituva pisteessä 0?

Nyt g'(x_0)= \begin{cases}+1, & \text{kun $x_{0}>0$} \\ -1, & \text{kun $x_{0}

Kuvaajalla y=g(x) ei ole tangenttia pisteessä x_0=0: \frac{g(0+h)-g(0)}{h}= \frac{|0+h|-|0|}{h}=\frac{|h|}{h}=\begin{cases}+1, & \text{kun $h>0$}, \\ -1, & \text{kun $h Näin ollen g'(0) ei ole olemassa.

Johtopäätös. Funktio g ei ole derivoituva pisteessä 0.

Huom. Olkoon f\colon (a,b)\to \mathbb{R}. Jos f'(x) on olemassa kaikissa pisteissä x\in (a,b), niin saadaan uusi funktio f'\colon (a,b)\to \mathbb{R}. Merkitään:

(1) f(x) = f^{(0)}(x),
(2) f'(x) =  f^{(1)}(x) =  \frac{d}{dx}f(x),
(3) f''(x) =  f^{(2)}(x) =  \frac{d^2}{dx^2}f(x),
(4) f'''(x) =  f^{(3)}(x) =  \frac{d^3}{dx^3}f(x),
...

Tässä f''(x) on funktion f toisen kertaluvun derivaatta pisteessä x, f^{(3)} on kolmannen kertaluvun derivaatta jne.

Yleisesti merkitään \begin{eqnarray} C^n\bigl( ]a,b[\bigr) =\{ f\colon \, ]a,b[\, \to \mathbb{R} & \mid & f \text{ on } n \text{ kertaa derivoituva välillä } ]a,b[ \nonumber \\ & & \text{ ja } f^{(n)} \text{ on jatkuva}\}. \nonumber \end{eqnarray} Tällaiset funktiot ovat n kertaa jatkuvasti derivoituvia.

Funktion g(x)=|x| kuvaaja.

Esimerkki 4.

Pyöräilijän paikkaa kuvaa funktio s(t). Pöyräilijän nopeus hetkellä t on s'(t) ja kiihtyvyys on s''(t).

Linearisointi ja differentiaali
Derivaattaa voidaan käyttää myös funktioiden approksimoimiseen. Määritelmästä seuraa, että  f'(x_0)\approx \frac{f(x)-f(x_0)}{x-x_0} \Leftrightarrow f(x)\approx f(x_0)+f'(x_0)(x-x_0), missä oikean puolen lauseke on funktion f linearisointi tai differentiaali pisteessä x_0. Differentiaalia merkitään df. Linearisoinnin kuvaaja  y=f(x_0)+f'(x_0)(x-x_0), on funktion kuvaajan tangentti pisteessä (x_0,f(x_0)). Differentiaalin varsinainen merkitys tulee näkyviin vasta usean muuttujan funktioiden yhteydessä, eikä sitä tarvita tällä kurssilla.

Kokeile.

Derivaatan ominaisuudet


Seuraavaksi käydään läpi derivaatan tärkeimmät ominaisuudet. Näiden avulla voidaan selvittää tärkeimpien alkeisfunktioiden derivaatat.

Jatkuvuus ja derivaatta

Jos f on derivoituva pisteessä x_0, niin f on jatkuva pisteessä x_0:  \lim_{h\to 0} f(x_0+h) = f(x_0). Miksi? Jos f on derivoituva, niin f(x_0)+h\frac{f(x_0+h)-f(x_0)}{h} \rightarrow f(x_0)+0\cdot f'(x_0)=f(x_0), kun h \to 0.

Note. Jos funktio on jatkuva pisteessä x_0, ei se välttämättä ole derivoituva tässä pisteessä. Esimerkiksi g(x) = |x| on jatkuva, muttei derivoituva pisteessä 0.

Derivointisäännöt

Seuraavien laskusääntöjen avulla monimutkaisempien funktioiden derivaattojen laskeminen palautuu helpompiin tapauksiin.

Oletetaan, että f ja g ovat derivoituvia pisteessä x.

Vakiokerroin

(cf)'(x) = cf'(x),\ c \in \mathbb{R}

Todistus.

Suppose that f is differentiable at x. We determine: (cf)'(x), where c\in \mathbb{R} is a constant.

\begin{aligned}\frac{(cf)(x+h)-(cf)(x)}{h} \ & \ = \ \frac{cf(x+h)-cf(x)}{h} \\ & \ = \ c \ \frac{f(x+h)-f(x)}{h}\end{aligned}

As h\to 0, we get c \ \frac{f(x+h)-f(x)}{h} \to c f'(x).

\square

Summan derivaatta

(f+g)'(x) = f'(x) + g'(x)

Todistus.

Suppose that f and g are differentiable at x. We determine (f+g)'(x).

By the definition: \begin{aligned}\frac{(f+g)(x+h)-(f+g)(x)}{h} \ & \ = \ \frac{[f(x+h)+g(x+h)]-[f(x)+g(x)]}{h} \\ & \ = \ \frac{f(x+h)-f(x)}{h}+\frac{g(x+h)-g(x)}{h}\end{aligned}

When h\to 0, we get \frac{f(x+h)-f(x)}{h}+\frac{g(x+h)-g(x)}{h}\to \ f'(x)+g'(x)

\square

Tulon derivaatta

(fg)'(x) = f'(x)g(x) + f(x)g'(x)

Todistus.

Suppose that f,g and are differentiable at x. We determine (fg)'(x). \begin{aligned}\frac{(fg)(x+h)-(fg)(x)}{h} & = \frac{f(x+h)g(x+h)-f(x)g(x)}{h} \\ & = \frac{f(x+h)g(x+h)-f(x)g(x+h)+f(x)g(x+h)-f(x)g(x)}{h} \\ & = \frac{f(x+h)-f(x)}{h}\ g(x+h)+f(x)\ \frac{g(x+h)-g(x)}{h}\end{aligned}

When h\to 0, we get \frac{f(x+h)-f(x)}{h}g(x+h)+f(x)\frac{g(x+h)-g(x)}{h}\to f'(x)g(x)+f(x)g'(x).

\square

Potenssin derivaatta

\frac{d}{dx} x^n = nx^{n-1} \text{, } n \in \mathbb{Z}

Todistus.

For  n\ge 1 we repeteadly apply the product rule, and obtain \begin{aligned}\frac{d}{dx}x^n \ & = \frac{d}{dx}(x\cdot x^{n-1}) \\ & = (\frac{d}{dx}x)x^{n-1}+x\frac{d}{dx}x^{n-1} \\ & \stackrel{dx/dx=1}{=} x^{n-1}+x\frac{d}{dx}x^{n-1} \\ & = x^{n-1}+x\left( x^{n-2}+x\frac{d}{dx}x^{n-2}\right) \\ & = \ldots \\ & = \sum_{k=0}^{n-1} x^{n-1} \\ & = nx^{n-1}.\end{aligned}

The case of negative  n is obtained from this and the product rule applied to the identity  x^n \cdot x^{-n} = 1.

From the power rule we obtain a formula for the derivative of a polynomial. Let P(x)=a_n x^{n}+a_{n-1}x^{n-1}+\ldots+ a_1 x + a_0, where n\in \mathbb{N}. Then \frac{d}{dx}P(x)=na_nx^{n-1}+(n-1)a_{n-1}x^{n-2}+\ldots +2 a_2 x+a_1.

\square

Osamäärän derivaatta: erikoistapaus

\Big(\frac{1}{f}\Big)'(x) = - \frac{f'(x)}{f(x)^2} \text{, } f(x) \neq 0

Todistus.

Suppose that f is differentiable at x and f(x)\neq 0. We determine (\frac{1}{f})'(x).

From the definition we obtain: \begin{aligned}\frac{(1/f)(x+h)-(1/f)(x)}{h} & = \frac{1/f(x+h)-1/f(x)}{h} \\ & = \frac{\frac{f(x)}{f(x)f(x+h)}-\frac{f(x+h)}{f(x)f(x+h)}}{h} \\ & = \frac{f(x)-f(x+h)}{h}\frac{1}{f(x)f(x+h)}\end{aligned}

Because f is differentiable at x we get \frac{f(x)-f(x+h)}{h}\frac{1}{f(x)f(x+h)}=-f'(x)/f(x)^2, as h\to 0.

\square

Osamäärän derivaatta

(f/g)'(x) = \frac{f'(x)g(x)-f(x)g'(x)}{g(x)^2},\ g(x) \neq 0

Todistus.

Suppose that f,g are differentiable at x and g(x)\neq 0. Then \begin{aligned}(f/g)'(x) & = \Big( f \cdot \frac{1}{g}\Big) '(x) \\ & = f'(x)\frac{1}{g(x)}-f(x)\frac{g'(x)}{g(x)^2} \\ & = \frac{f'(x)g(x)-f(x)g'(x)}{g(x)^2}.\end{aligned}

\square

Kokeile. Siirrä pistettä x_0 ja tutki vakiokertoimen vaikutusta käytännössä.

Esimerkki 1.

\frac{d}{dx}(x^{2006}+5x^3+42)=\frac{d}{dx}x^{2006}+5\frac{d}{dx}x^3+42\frac{d}{dx}1=2006x^{2005}+5\cdot 3x^2.

Esimerkki 2.

\begin{aligned}\frac{d}{dx} [(x^4-2)(2x+1)] &= \frac{d}{dx}(x^4-2) \cdot (2x+1) + (x^4-2) \cdot \frac{d}{dx}(2x + 1) \\ &= 4x^3(2x+1) + 2(x^4-2) \\ &= 8x^4+4x^3+2x^4-4 \\ &= 10x^4+4x^3-4.\end{aligned}

Toinen tapa: \frac{d}{dx} [(x^4-2)(2x+1)] = \frac{d}{dx} (2x^5 +x^4 -4x -2) = 10x^4 +4x^3 -4.

Funktion  (x^4-2)(2x+1) kuvaaja.

Esimerkki 3.

 Alueessa x \neq 0 on \frac{d}{dx} \frac{3}{x^3} = 3 \cdot \frac{d}{dx} \frac{1}{x^3} = -3 \cdot \frac{\frac{d}{dx} x^3}{(x^3)^2} = -3 \cdot \frac{3x^2}{x^6}= - \frac{9}{x^4}.

Toinen tapa: Koska\frac{1}{x^3} = x^{-3}, niin \frac{d}{dx} \ \frac{3}{x^3} = 3 \cdot \frac{d}{dx} x^{-3} = 3 \cdot (-3x^{-4})= - \frac{9}{x^4}

Esimerkki 4.

\begin{aligned}\frac{d}{dx} \frac{x^3}{1+x^2} & = \frac{(\frac{d}{dx}x^3)(1+x^2)-x^3\frac{d}{dx}(1+x^2)}{(1+x^2)^2} \\ & = \frac{3x^2(1+x^2)-x^3(2x)}{(1+x^2)^2} \\ & = \frac{3x^2+x^4}{(1+x^2)^2}.\end{aligned}

Funktion x^3 / (1+x^2) kuvaaja.

Rollen lause

Jos f on derivoituva paikallisessa ääriarvokohdassa x_0\in \, ]a,b[, niin f'(x_0)=0.

Todistus.

The one-sided limits of the difference quotient have different signs at a local extremum. For example, for a local maximum it holds that \begin{eqnarray} \frac{f(x_0+h)-f(x_0)}{h} = \frac{\text{negative} }{\text{positive}}&\le& 0, \text{ when } h>0, \nonumber \\ \frac{f(x_0+h)-f(x_0)}{h} = \frac{\text{negative}}{\text{negative}}&\ge& 0, \text{ when } h<0 \nonumber \end{eqnarray} and |h| is so small that f(x_0) is a maximum on the interval [x_0-h,x_0+h].


L'Hospitalin sääntö

Tästä säännöstä on monia eri versioita, mutta tässä käsitellään vain yksi tapaus. Oletetaan, että f(x_0)=g(x_0)=0 ja että funktiot f,g ovat derivoituvia jollakin välillä ]x_0-\delta,x_0+\delta[. Jos  \lim_{x\to x_0}\frac{f'(x)}{g'(x)} on olemassa, niin  \lim_{x\to x_0}\frac{f(x)}{g(x)}=\lim_{x\to x_0}\frac{f'(x)}{g'(x)}.

Proof (idea).

In the special case g'(x_0)\neq 0 the proof is simple:  \frac{f(x)}{g(x)}=\frac{f(x)-f(x_0)}{g(x)-g(x_0)} = \frac{\bigl( f(x)-f(x_0)\bigr) /(x-x_0)}{\bigl( g(x)-g(x_0)\bigr) /(x-x_0)} \to \frac{f'(x_0)}{g'(x_0)}. In the general case we need the so-called generalized mean value theorem, which states that  \frac{f(x)}{g(x)} = \frac{f'(c)}{g'(c)} for some c\in \, ]x_0,x[. Here we have the same point c both in the numerator and the denominator, so we do not even need the continuity of the derivatives!

Trigonometristen funktioiden derivaatat


Tässä kappaleessa johdetaan funktioiden \sin, \cos ja \tan derivaatat.

Sinin derivaatta

\sin'(t)=\cos(t)

Todistus.

Funktion \sin(x) ja sen derivaatan \cos(x) kuvaajat.

Kosinin derivaatta

\cos'(t)= - \sin(t)

Todistus.

This follows in a similar way as the derivative of Sine, but more easily from the identity \cos(t)=\sin(\pi/2-t) and the Chain rule to be introduced in the following section.

\square

Funktion \cos(x) ja sen derivaatan  -\sin(x) kuvaajat.

Tangentin derivaatta

\tan'(t) = \frac{1}{\cos^2(t)}=1+\tan^2 t.

Todistus.

Because \tan(t)=\frac{\sin(t)}{\cos(t)}, from the quotient rule we obtain \tan'(t)=\frac{\sin'(t)\cos(t)-\sin(t)\cos'(t)}{\cos^2(t)}=\frac{\cos^2(t)+\sin^2(t)}{\cos^2(t)}=\begin{cases}\frac{1}{\cos^2(t)} & \\ 1+\tan^2 t.\end{cases}

\square

Funktion \tan(x) ja sen derivaatan 1/\cos^2(x) kuvaajat.

Esimerkki 1.

\frac{d}{dx} (3 \sin(x)) = 3 \sin'(x) = 3 \cos(x).

Esimerkki 2.

\frac{d}{dx} \cos^2 (x) = \cos'(x) \cdot \cos(x) + \cos(x) \cdot \cos'(x) = -2\sin(x)\cos(x).

Esimerkki 3.

\begin{aligned}
		\frac{d}{dx} \frac{\sin(x) + 1}{\cos(x)} &= \frac{d}{dx} \left( \frac{\sin(x)}{\cos(x)} + \frac{1}{\cos(x)} \right) \\
		&= \tan'(x) - \frac{\cos'(x)}{\cos^2(x)} \\
		&= \frac{1+\sin(x)}{\cos^2 (x)}.\end{aligned}

Ketjusääntö


Ketjusäännöllä tarkoitetaan yhdistettyjen funktioiden derivoimissääntöä. Tämä termin tausta selittyy paremmin usean muuttujan funktioiden (osittais)derivaattojen yhteydessä.

Ketjusääntö.

Olkoon f\colon \mathbb{R}\to \mathbb{R}, g\colon \mathbb{R}\to \mathbb{R} ja f \circ g \colon \mathbb{R}\to \mathbb{R}.

Jos g on derivoituva pisteessä x ja f derivoituva pisteessä g(x), niin \frac{d}{dx}f(g(x))=f'(g(x))g'(x).

Todistus.

Consider

\begin{aligned}\frac{f(g(x+h))-f(g(x))}{h} &= \frac{f(g(x+h))-f(g(x))}{h} \ \frac{g(x+h)-g(x)}{g(x+h)-g(x)} \\
			&= \frac{f(g(x+h))-f(g(x))}{g(x+h)-g(x)} \ \frac{g(x+h)-g(x)}{h}.\end{aligned}

Now let us write k(h):=g(x+h)-g(x). Then g(x+h)=g(x)+k(h) and we get \frac{f(g(x+h))-f(g(x))}{h}=\frac{f(g(x)+k(h))-f(g(x))}{k(h)}\frac{g(x+h)-g(x)}{h}.

Ongelma. Entä, jos k(h)=0? Nollalla ei voi jakaa.

Ratkaisu. Define E(k):= \begin{cases}0, & \text{for  $k=0$}, \\
			\frac{f(g(x)+k)-f(g(x))}{k}-f'(g(x)), & \text{for  $k\neq 0$},\end{cases} so that \frac{f(g(x+h))-f(g(x))}{h}=[E(k(h))+f'(g(x))]\frac{g(x+h)-g(x)}{h}. Now, because E is continuous, we get [E(k(h))+f'(g(x))]\frac{g(x+h)-g(x)}{h}\to f'(g(x))g'(x). as h\to 0.

\square

Esimerkki 1.

Lasketaan funktion (2x-1)^3 derivaatta. Merkitään f(x) = x^3 ja g(x) = 2x-1, jolloin kyseessä on yhdistetty funktio f(g(x)). Koska f'(x) = 3x^2 \text{ ja } g'(x) = 2, niin \frac{d}{dx} (2x-1)^3 = 3(2x-1)^2 \cdot 2 = 6(4x^2-4x+1) = 24x^2-24x+6.

Funktion (2x-1)^3 ja sen derivaatan kuvaajat.

Esimerkki 2.

Lasketaan funktion \sin 3x derivaatta. Merkitään f(x) = \sin x ja g(x) = 3x, jolloin kyseessä on yhdistetty funktio f(g(x)). Näin ollen \frac{d}{dx} \sin 3x = \cos 3x \cdot 3 = 3 \cos 3x.

Huom. Olkoon h\colon \mathbb{R}\to \mathbb{R}, g\colon \mathbb{R}\to \mathbb{R} ja f\colon \mathbb{R}\to \mathbb{R}. Tällöin \frac{d}{dx}f(g(h(x)))=f'(g(h(x)))\frac{d}{dx}g(h(x))=f'(g(h(x)))g'(h(x))h'(x). Vastaavalla tavalla saadaan monimutkaisempia kaavoja, mutta tärkeämpää on muistaa yleinen periaate.

Funktion \sin 3x ja sen derivaatan kuvaajat.

Esimerkki 3.

Lasketaan funktion \cos^3 2x derivaatta. Merkitään f(x) = x^3, g(x) = \cos x ja h(x) = 2x, jolloin kyseessä on yhdistetty funktio f(g(h(x))). Näin ollen \begin{aligned}\frac{d}{dx} \cos^3 2x &= 3(\cos 2x)^2 \cdot \frac{d}{dx} \cos 2x \\
		&= 3 \cos^2 2x \cdot (-\sin 2x) \cdot 2 \\
		&= -6 \sin 2x \cos^2 2x.\end{aligned}

Funktion \cos^3 2x ja sen derivaatan kuvaajat.

Ääriarvot


Tässä kappaleessa tarkastellaan derivaatan käyttöä ääriarvotehtävissä.

Määritelmä: Paikallinen maksimi ja minimi

Funktiolla f\colon A\to \mathbb{R} on  paikallinen maksimi pisteessä x_0\in A, jos on olemassa sellainen h\gt 0, että f(x)\leq f(x_0) aina kun  x\in A ja |x-x_0|\lt h.

Vastaavasti, funktiolla f\colon A\to \mathbb{R} on paikallinen minimi pisteessä x_0\in A , jos on olemassa sellainen h>0, että f(x)\geq f(x_0) aina kun  x\in A ja |x-x_0|\lt h.

Funktion paikallinen ääriarvo tarkoittaa joko paikallista maksimia tai paikallista minimiä.

Huom. Jos x_0 on paikallinen maksimikohta ja f'(x_0) on olemassa, niin \begin{cases}f'(x_0) & =\lim_{h\to 0^{+}}\frac{f(x_0+h)-f(x_0)}{h} \leq 0 \\
		f'(x_0) & =\lim_{h\to 0^{-}}\frac{f(x_0+h)-f(x_0)}{h} \geq 0.\end{cases} Näin ollen f'(x_0)=0.

Näin saadaan:

Lause 1.

Olkoon x_0\in [a,b] jatkuvan funktion function f\colon [a,b]\to \mathbb{R} paikallinen ääriarvokohta. Silloin joko

  1. derivaattaa f'(x_0) ei ole olemassa (tämä sisältää myös tapaukset x_0=a ja x_0=b), tai

  2. f'(x_0)=0.

Esimerkki 1.

Määritellään f: \mathbb{R} \to \mathbb{R} kaavalla f(x) = x^3 -3x + 1. Silloin f'(x) = 3x^2-3 ja pisteissä x_0 = -1 ja x_0 = 1 funktiolla f on paikallinen maksimi ja minimi, f'(-1) = 3 \cdot (-1)^2 - 3 = 0 \text{ ja } f'(1) = 3 \cdot 1^2 - 3 = 0.

Funktion x^3-3x+1 ja sen derivaatan 3x^2-3 kuvaajat.

Globaali maksimi ja minimi

Käytännössä paikallisia ääriarvoja voi esiintyä kolmea eri tyyppiä olevissa pisteissä:

  1. derivaatan nollakohdat

  2. määrittelyvälin päätepisteet

  3. määrittelyvälin sisällä olevat kohdat, joissa funktio ei ol e derivoituva

Jos tiedetään etukäteen, että funktiolla on maksimi tai minimi, niin aluksi etsitään kaikki mahdolliset paikalliset ääriarvokohdat (yllä oleva lista), lasketaan funktion arvot näissä pisteissä ja valitaan näistä arvoista suurin tai pienin.

Esimerkki 2.

Määritetään funktion f\colon [0,2]\to \mathbf{R}, f(x)=x^3-6x, suurin ja pienin arvo. Koska kyseessä on suljetulla välillä jatkuva funktio, niin sillä on maksimi ja minimi. Funktio on myös derivoituva, joten riittää tutkia välin päätepisteet ja välin sisälle jäävät derivaatan nollakohdat.

Derivaatan nollakohdat: f'(x)=3x^2-6=0 \Leftrightarrow x=\pm \sqrt{2}. Koska -\sqrt{2}\not\in [0,2], täytyy laskea funktion arvot vain kolmessa pisteessä: f(0)=0, f(\sqrt{2})=-4\sqrt{2} ja f(2)=-4. Näiden avulla päätellään funktion pienimmäksi arvoksi -4\sqrt{2} ja suurimmaksi arvoksi 0.

Seuraavaksi esitetään eräs tärkeimmistä derivoituvia funktioita koskevista tuloksista.

Lause 2.

(Derivoituvien funktioiden väliarvolause). Olkoon f\colon [a,b]\to \mathbb{R} jatkuva suljetulla välillä [a,b] ja derivoituva avoimella välillä (a,b). Silloin f'(x_0)=\frac{f(b)-f(a)}{b-a} jollekin x_0\in (a,b).

Todistus.

Let f be continuous in the interval [a,b] and differentiable in the interval (a,b). Let us define g(x):=f(x)-\frac{f(b)-f(a)}{b-a}(x-a)-f(a).

Now g(a)=g(b)=0 and g is differentiable in the interval (a,b). According to Rolle's Theorem, there exists c\in(a,b) such that g'(c)=0. Hence f'(c)=g'(c)+\frac{f(b)-f(a)}{b-a}=\frac{f(b)-f(a)}{b-a}.

\square

Tärkeitä seurauksia:

Lause 3.

Olkoon f\colon (a,b)\to \mathbb{R} derivoituva. Silloin pätee:

  1. Jos f'(x)\geq 0 kaikilla x\in (a,b), niin f on kasvava,

  2. Jos f'(x)\leq 0 kaikilla x\in (a,b), niin f on vähenevä.

Todistus.

Suppose that a \lt x_1 \lt x_2 \lt b.

Then by Theorem 2 there exists x_0\in (x_1,x_2) such that f'(x_0)=\frac{f(x_2)-f(x_1)}{x_2-x_1}.

It follows that f(x_2)-f(x_1)=f'(x_0)(x_2-x_1).

Hence we may conclude that f is increasing for f'(x_0)\geq 0 and decreasing for f'(x_0)\leq 0.

Esimerkki 3.

Polynomin f(x) = \frac{1}{4} x^4-2x^2-7 derivaatalle pätee  f'(x) = x^3-4x = x(x^2-4) = 0, kun x=0, x=2 or x=-2. Muodostetaan kulkukaavio:

x -2 \lt x \lt 0 0 \lt x \lt 2 x>2
x >0 >0
x^2-4 >0 >0
f'(x) >0 >0
f(x) väh. kasv. väh. kasv.

Funktion \frac{1}{4} x^4-2x^2-7 kuvaaja.

Esimerkki 4.

Määritetään sellainen suorakulmio, jonka pinta-ala on 9 ja jonka piiri on mahdollisimman pieni.

Olkoot x\ (>0) ja y\ (>0) suorakulmion sivut. Silloin x \cdot y = 9, joten y=\frac{9}{x}. Suorakulmion piiri on 2x+2y = 2x+2 \frac{9}{x} = \frac{2x^2+18}{x}. Etsitään funktion f(x) = \frac{2x^2+18}{x} pienin arvo. Funktio f on derivoituva, kun x>0, ja osamäärän derivoimissäännön mukaan f'(x) = \frac{4x \cdot x-(2x^2+18) \cdot 1}{x^2} = \frac{2x^2-18}{x^2}. Nyt f'(x) = 0, kun \begin{aligned}2x^2-18 &= 0 \\
		2x^2 &= 18 \\
		x^2 &= 9 \\
		x &= \pm 3\end{aligned} mutta ehdon x>0 perusteella vain x=3 on mahdollinen. Muodotetaan kulkukaavio:

x x>3
f'(x) >0
f(x) väh. kasv.

Koska funktio f on jatkuva, niin se saavuttaa miniminsä pisteessä x=3. Tällöin sen toisen sivun pituus on y=\frac{9}{x}=\frac{9}{3}=3.

Vastaus on siis neliö, jonka sivun pituus on 3.

Funktion \frac{2x^2+18}{x} kuvaaja.

Esimerkki 5.

Tehtävänä on muodostaa suoran ympyräsylinterin muotoinen yhden litran mitta (ilman kantta) niin, että materiaalia tarvitaan mahdollisimman vähän.

Olkoon r > 0 sylinterin poikkileikkauksen säde ja h > 0 sylinterin korkeus. Sylinterin tilavuus on 1 dm^3, joten saadaan yhtälö \pi r^2 h = 1. Tästä voidaan ratkaista h = \frac{1}{\pi r^2}.

Tarvittavan materiaalin määrää kuvaa pinta-ala A_{\text{bottom}} + A_{\text{side}} = \pi r^2 + 2 \pi r h = \pi r^2 + \frac{2 \pi r}{\pi r^2} = \pi r^2 + \frac{2}{r}.

Määritellään siis f: (0, \infty) \to \mathbb{R} asettamalla f(r) = \pi r^2 + \frac{2}{r}. Tavoitteena on etsiä funktion f minimi, ja kyseessä on alueessa r>0 derivoituva funktio. Derivaataksi saadaan f'(r) = 2\pi r -2 \cdot \frac{1}{r^2} = \frac{2\pi r^3 - 2}{r^2}. Nyt f'(r) = 0, kun \begin{aligned}2\pi r^3 - 2 &= 0 \\
		2\pi r^3 &= 2 \\
		r^3 &= \frac{1}{\pi} \\
		r &= \frac{1}{\sqrt[3]{\pi}}.\end{aligned}

Muodostetaan kulkukaavio:

r r>\frac{1}{\sqrt[3]{\pi}}
f'(r) >0
f(r) väh. kasv.

Koska funktio f on jatkuva, niin sen pienin arvo saavutetaan kohdassa r= \frac{1}{\sqrt[3]{\pi}} \approx 0.683. Silloin h = \frac{1}{\pi r^2} = \frac{1}{\pi \left(\frac{1}{\sqrt[3]{\pi}}\right)^2} = \frac{1}{\frac{\pi}{\pi^{2/3}}} = \frac{1}{\sqrt[3]{\pi}} \approx 0.683.

Näin ollen optimaalisen mitan poikkileikkauksen läpimitta on 2 \cdot 0.683 dm  = 1.366 dm  \approx 13.7 cm ja korkeus 0.683 dm  \approx 6.8 cm.

Funktion \pi r^2 + \frac{2}{r} kuvaaja.

', strokeColor : '#b942f5', fillColor : 'black', strokeWidth : 1, fillOpacity : .5, showinfobox : false, label : { useMathJax : true } }); board.create('segment', [x0,function() { return [x0.X(),f(x0.X())]; }], { dash : 1, strokeColor : '#b942f5' }); var g1 = board.create('glider', [function() { return x0.X(); }, function() { return f(x0.X()); }, graph], { visible : false }); var t = board.create('tangent', [g1], { strokeWidth : 1.5, strokeColor : '#b942f5' }); board.create('line', [[function() { return x0.X(); }, function() { return f(x0.X()); }], [function() { return x0.X()+.7; }, function() { return f(x0.X()+.7); }]], { strokeOpacity : .5, strokeWidth : 1.5 }); board.create('line', [[function() { return x0.X(); }, function() { return f(x0.X()); }], [function() { return x0.X()+1.4; }, function() { return f(x0.X()+1.4); }]], { strokeOpacity : .5, strokeWidth : 1.5 }); board.create('line', [[function() { return x0.X(); }, function() { return f(x0.X()); }], [function() { return x0.X()+2.1; }, function() { return f(x0.X()+2.1); }]], { strokeOpacity : .5, strokeWidth : 1.5 }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox02', { boundingbox : [-5, 7, 5, -4], shownavigation : false, axis : true }); var f = function(x) { return x*x*x+2*x*x; } var graph = board.create('functiongraph', [f, -5, 5], { strokeWidth : 2, strokeColor : 'black' }); var g1 = board.create('glider', [.5, f(.5), graph], { strokeWidth : 1, size : 5.5, strokeColor : 'black', fillColor : 'gray', name : 'df', label : { strokeColor : 'blue' } }); var t = board.create('tangent', [g1], { strokeWidht : 2, strokeOpacity : .8 }); var text1 = board.create('text', [-4, 5, function() { return 'f(x) = x^3+2x^2'}], { useMathJax : true, fontSize : 14, strokeColor : 'black' }); var text2 = board.create('text', [-4, 4, function() { var k = t.getSlope(); var b = g1.Y()-k*g1.X(); var temp = ''; if(k == 0) { temp = 'df=' + b.toFixed(2) +''; } else { if(b < 0) { temp = 'df=' + k.toFixed(2) + 'x' + b.toFixed(2) + ''; } else { temp = 'df=' + k.toFixed(2) + 'x + ' + b.toFixed(2) + ''; } } return temp; } ], { useMathJax : true, fontSize : 14, strokeColor : 'blue' }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox03', { boundingbox : [-3.5, 3, 3.5, -3], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0],[1, 0]], { ticks : { majorHeight : 5 } }); var yaxis = board.create('axis' ,[[0, 0],[0, 1]], { ticks : { majorHeight : 5} }); var f = function(x) { return x*x*x+1; } var graph = board.create('functiongraph', [f, -3.5, 3.5], { strokeWidth : 1.5, strokeColor : 'black' }); var g1 = board.create('glider', [1, f(1), graph], { strokeColor : 'black', size : 2, fillColor : 'red', name : '' }); var t = board.create('tangent', [g1], { strokeColor : 'red', strokeWidth : 1.5 }); var a = board.create('segment', [[function() { return g1.X() }, function() { return g1.Y()-t.getSlope(); }], [function() { return g1.X()-1; }, function() { return g1.Y()-t.getSlope() }]], { strokeWidth : 2, strokeOpacity : .8, dash : 1, highlight : false }); var b = board.create('segment', [[ function() { return g1.X(); }, function() { return g1.Y(); }], [ function() { return a.point1.X(); }, function() { return a.point1.Y(); } ]], { strokeWidth : 2, strokeOpacity : .8, dash : 1, highlight : false }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox04', { boundingbox : [-5, 5, 5, -2], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); xaxis.defaultTicks.ticksFunction = function() { return 1; }; yaxis.defaultTicks.ticksFunction = function() { return 1; }; var f = function(x) { return Math.abs(x); } board.create('functiongraph', [f, -5, 5], { strokeWidth : 2, strokeColor : '#2183de', highlight : false }); board.create('text', [1.5, 1.2, function() { return 'f(x)=|x|'; }], { useMathJax : true, strokeColor : '#2183de', fontSize : 13, fixed : true, highlight : false }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox05', { boundingbox : [-1.7, 10.1, 1.7, -10.1], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); xaxis.defaultTicks.ticksFunction = function() { return 1; }; yaxis.defaultTicks.ticksFunction = function() { return 5; }; var f = function(x) { return (x*x*x*x-2)*(2*x+1); } board.create('functiongraph', [f, -1.7, 1.7], { strokeWidth : 2.5, strokeColor : 'black', highlight : false }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox06', { boundingbox : [-6.1, 6.5, 6.1, -6.5], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); xaxis.defaultTicks.ticksFunction = function() { return 2; }; yaxis.defaultTicks.ticksFunction = function() { return 2; }; var f = function(x) { return x*x*x/(1+x*x); } board.create('functiongraph', [f, -6.1, 6.1], { strokeWidth : 2.5, strokeColor : 'black', highlight : false }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox07', { boundingbox : [-6.77, 6, 6.77, -6], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return Math.sin(x); } var df = function(x) { return Math.cos(x); } board.create('functiongraph', [f, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'red' }); board.create('functiongraph', [df, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'black' }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox08', { boundingbox : [-6.77, 6, 6.77, -6], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return Math.cos(x); } var df = function(x) { return Math.sin(x); } board.create('functiongraph', [f, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'blue' }); board.create('functiongraph', [df, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'black' }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox09', { boundingbox : [-6.77, 6, 6.77, -6], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return Math.tan(x); } var df = function(x) { return 1/Math.pow(Math.cos(x),2); } board.create('functiongraph', [f, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'green' }); board.create('functiongraph', [df, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'black' }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox10', { boundingbox : [-3.2, 4.5, 4.8, -2.5], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return Math.pow(2*x*x-1, 3); } var df = function(x) { return 6*Math.pow(2*x*x-1, 2); } board.create('functiongraph', [f, 0, 4.8], { strokeWidth : 1.5, strokeColor : 'green' }); board.create('functiongraph', [df, 0, 4.8], { strokeWidth : 1.5, strokeColor : 'black' }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox11', { boundingbox : [-6.77, 6, 6.77, -6], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return Math.sin(3*x); } var df = function(x) { return 3*Math.cos(x); } board.create('functiongraph', [f, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'red' }); board.create('functiongraph', [df, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'black' }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox12', { boundingbox : [-6.77, 6, 6.77, -6], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return Math.pow(Math.cos(2*x), 3); } var df = function(x) { return -6*Math.sin(2*x)*Math.pow(Math.cos(2*x), 2); } board.create('functiongraph', [f, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'blue' }); board.create('functiongraph', [df, -6.77, 6.77], { strokeWidth : 1.5, strokeColor : 'black' }); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox13', { boundingbox : [-4.73, 4.2, 4.73, -4.2], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return x*x*x-3*x+1; } var df = function(x) { return 3*x*x-3; } board.create('functiongraph', [f, -3.2, 3.2], { strokeWidth : 1.5, strokeColor : 'blue' }); board.create('functiongraph', [df, -3.2, 3.2], { strokeWidth : 1.5, strokeColor : 'red' }); var p = []; p[0] = board.create('point', [-1, f(-1)]); p[1] = board.create('point', [-1, df(-1)]); p[2] = board.create('point', [1, f(1)]); p[3] = board.create('point', [1, df(1)]); for(var i=0; i < p.length; i++) { p[i].setAttribute({ strokeColor : 'black', size : .5, name : '', fillColor : 'black', fixed : true }); } board.create('segment', [p[0],p[1]], { strokeColor : 'black', dash : 1, highlight : false }); board.create('segment', [p[2],p[3]], { strokeColor : 'black', dash : 1, highlight : false }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox14', { boundingbox : [-6.76, 1, 6.76, -11], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); var f = function(x) { return Math.pow(x, 4)/4-2*x*x-7; } board.create('functiongraph', [f, -5.6, 5.6], { strokeWidth : 1.5, strokeColor : 'black' }); var p = []; p[0] = board.create('point', [-2, 0], { }); p[1] = board.create('point', [-2, f(-2)], { }); p[2] = board.create('point', [0, 0], { }); p[3] = board.create('point', [0, f(0)], { }); p[4] = board.create('point', [2, 0], { }); p[5] = board.create('point', [2, f(2)], { }); for(var i=0; i < p.length; i++) { p[i].setAttribute({ visible : false }); } board.create('segment', [p[0],p[1]], { strokeColor : 'red', highlight : false, fixed : true }); board.create('segment', [p[2],p[3]], { strokeColor : 'blue', highlight : false, fixed : true }); board.create('segment', [p[4],p[5]], { strokeColor : 'red', highlight : false, fixed : true }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox15', { boundingbox : [-1, 15, 10, -1.5], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); xaxis.defaultTicks.ticksFunction = function() { return 2; }; yaxis.defaultTicks.ticksFunction = function() { return 2; }; var f = function(x) { return (2*x*x+18)/x; } var graph = board.create('functiongraph', [f, -1, 15.9], { strokeColor : 'black', strokeWidth : 2.5, highlight : false }); var p = []; p[0] = board.create('point', [3, 0]); p[1] = board.create('point', [3,f(3)]); for(var i=0; i < p.length; i++) { p[i].setAttribute({ name : '', size : 1, strokeColor : 'black', strokeWidth : .5, fixed : true }); } board.create('segment', [p[0], p[1]], { dash : 1, strokeWidth : 2, strokeColor : 'red', fixed : true, highlight : false }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox16', { boundingbox : [-1, 13, 5, -1], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); xaxis.defaultTicks.ticksFunction = function() { return 2; }; yaxis.defaultTicks.ticksFunction = function() { return 2; }; var f = function(x) { return Math.PI*x*x+2/x; } var graph = board.create('functiongraph', [f, 0, 5], { strokeColor : 'black', strokeWidth : 2.5, highlight : false }); var p = []; var a = 1/Math.pow(Math.PI,1/3); p[0] = board.create('point', [a, 0]); p[1] = board.create('point', [a, f(a)]); for(var i=0; i < p.length; i++) { p[i].setAttribute({ name : '', size : 1, strokeColor : 'black', fixed : true }); } board.create('segment', [p[0], p[1]], { dash : 1, strokeWidth : 2, strokeColor : 'red', fixed : true, highlight : false }); board.fullUpdate(); })(); (function() { var board = JXG.JSXGraph.initBoard('jxgbox17', { boundingbox : [-4, 4, 4, -4], axis : false, shownavigation : false, showcopyright : false }); var xaxis = board.create('axis', [[0, 0], [1, 0]], { highlight : false, drawZero : true, ticks : { minorTicks : 0, majorHeight : 9, label : { highlight : false, offset : [-5, -15] } } }); var yaxis = board.create('axis', [[0, 0], [0, 1]], { highlight : false, ticks : { minorTicks : 0, majorHeight : 9, label : { offset : [-15, 0 ], position : 'lrt', highlight : false } } }); xaxis.defaultTicks.ticksFunction = function() { return 1; }; yaxis.defaultTicks.ticksFunction = function() { return 1; }; var s = board.create('slider', [[-3.5, 3.5], [-.5, 3.5], [-10, 0, 10]],{ suffixLabel : ' c=',
			postLabel		:	'', label : { useMathJax : true, fontSize : 13 }, fillColor : '#31d490', withTicks : false, precision : 2, snapWidth : 1 }); var f = function(x) { return x*x*x-x; } var g = function(x) { return s.Value()*(x*x*x-x); } var graph1 = board.create('functiongraph', [f, -4, 4], { strokeColor : '#4260f5', strokeWidth : 2.5, highlight : false, strokeOpacity : 0.6, highlight : false }); var graph2 = board.create('functiongraph', [g, -4, 4], { strokeColor : '#31d490', strokeWidth : 2.5, highlight : false, strokeOpacity : .8, highlight : false }); var g0 = board.create('glider', [0, 0, xaxis], { name : 'x' + '_' + '0', size : 4, strokeColor : 'black', strokeWidth : .7, fillColor : '#42f57e', label : { useMathJax : true } }); var g1 = board.create('glider', [0, 0, graph1], { name : '', size : 2, strokeWidth : .7, strokeColor : 'black', fillColor : '#42f57e', fixed : true, highlight : false }); var l1 = board.create('line', [g0, g1], { straightFirst : false, strokeColor : '#42f57e', dash : 1, highlight : false }); var g2 = board.create('glider', [0, 0, graph2], { visible : false }); var t1 = board.create('tangent', [g1], { strokeColor : '#4260f5', strokeWidth : 2.5, strokeOpacity : 0.6, highlight : false }); var t2 = board.create('tangent', [g2], { strokeColor : '#31d490', strokeWidth : 2.5, strokeOpacity : .8, highlight : false }); board.create('text', [-3.5, 2.8, function() { return 'f(x)=\\color{#4260f5}{x^3-x}'; }], { useMathJax : true, fontSize : 13, strokeColor : 'black', fixed : true, highlight : false }); board.create('text', [-3.5, 2.3, function() { return 'g(x)=c\\color{#31d490}{(x^3-x)}'; }], { useMathJax : true, fontSize : 13, strokeColor : 'black', fixed : true, highlight : false }); board.create('text', [1.5, -2, function() { return 'f\'(x_{0})=\\color{#4260f5}{' + t1.getSlope().toFixed(3) + '}'; }], { useMathJax : true, fontSize : 13, strokeColor : 'black', fixed : true, highlight : false }); board.create('text', [1.5, -2.5, function() { return 'g\'(x_{0})=\\color{#31d490}{' + t2.getSlope().toFixed(3) + '}'; }],{ useMathJax : true, fontSize : 13, strokeColor : 'black', fixed : true, highlight : false }); g0.on('drag', function() { var x = g0.X(); g1.moveTo([x, f(x)]); g2.moveTo([x, g(x)]); board.update(); }); board.fullUpdate(); })(); "; } ], { fontSize : 15 });*/ board.unsuspendUpdate(); } } function addDerivative() { if (JXG.isFunction(f)) { board.create('functiongraph',[JXG.Math.Numerics.D(f), function(){ var c = new JXG.Coords(JXG.COORDS_BY_SCREEN,[0,0],board); return c.usrCoords[1]; }, function(){ var c = new JXG.Coords(JXG.COORDS_BY_SCREEN,[board.canvasWidth,0],board); return c.usrCoords[1]; }], { dash : 2, strokeWidth : 2, strokeColor : '#3ac946' }); } } document.getElementById('plot').onclick = plotter; document.getElementById('clear all').onclick = clearAll; document.getElementById('add tangent').onclick = addTangent; document.getElementById('add Derivative').onclick = addDerivative; })();

5. Taylor-polynomi

Sisältö

Taylor-polynomi


Esimerkki

Verrataan funktion \sin x kuvaajaa (punainen) polynomien 
	x-\frac{x^3}{3!}+\frac{x^5}{5!}-\dots + \frac{(-1)^nx^{2n+1}}{(2n+1)!}
	kuvaajiin (sininen) arvoilla n=1,2,3,\dots,12.

Kokeile. Funktio sin ja polynomi

\displaystyle\sum_{k=0}^{n}\frac{(-1)^{k}x^{2k+1}}{(2k+1)!}

Määritelmä: Taylor-polynomi

Olkoon f funktio, joka on k kertaa derivoituva pisteessä x_{0}. Tällöin Taylor-polynomi \begin{align} P_n(x)&=P_n(x;x_0)\\\ &=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)^2+ \\ & \dots +\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n\\ &=\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}(x-x_0)^k\\ \end{align} on (derivaattojen suhteen) paras n-asteinen polynomiapproksimaatio funktiolle f pisteen x_0 lähellä.

Huom. Tapauksessa x_0=0 käytetään usein nimeä Maclaurin-polynomi.


Jos f on n kertaa derivoituva pisteessä x_0, niin Taylor-polynomilla on pisteessä x_0 samat derivaatat kuin funktiolla f, aina (derivaatan) kertalukuun n saakka.

Syy (tapaus x_0=0): Olkoon 
		P_n(x)=c_0+c_1x+c_2x^2+c_3x^3+\dots +c_nx^n,
	jolloin \begin{align} P_n'(x)&=c_1+2c_2x+3c_3x^2+\dots +nc_nx^{n-1}, \\ P_n''(x)&=2c_2+3\cdot 2 c_3x\dots +n(n-1)c_nx^{n-2} \\ P_n'''(x)&=3\cdot 2 c_3\dots +n(n-1)(n-2)c_nx^{n-3} \\ \dots && \\ P^{(k)}(x)&=k!c_k + x\text{ termejä} \\ \dots & \\ P^{(n)}(x)&=n!c_n \\ P^{(n+1)}(x)&=0. \end{align}

Tämän avulla kertoimet voidaan ratkaista yksi kerrallaan: \begin{align} c_0= P_n(0)=f(0) &\Rightarrow c_0=f(0) \\ c_1=P_n'(0)=f'(0) &\Rightarrow c_1=f'(0) \\ 2c_2=P_n''(0)=f''(0) &\Rightarrow c_2=\frac{1}{2}f''(0) \\ \vdots & \\ k!c_k=P_n^{(k)}(0)=f^{(k)}(0) &\Rightarrow c_k=\frac{1}{k!}f^{(k)}(0). \\ \vdots &\\ n!c_n=P_n^{(n)}(0)=f^{(n)}(0) &\Rightarrow c_k=\frac{1}{n!}f^{(n)}(0). \end{align} Kertaluvusta k=n+1 alkaen lisäehtoja ei voi enää asettaa, koska P^{(n+1)}(x)=0.

Taylorin kaava

Jos derivaatta f^{(n+1)} on olemassa ja jatkuva jollakin välillä I=\, ]x_0-\delta,x_0+\delta[, niin f(x)=P_n(x;x_0)+E_n(x) ja virhetermille E_n(x) pätee 
		E_n(x)=\frac{f^{(n+1)}(c)}{(n+1)!}(x-x_0)^{n+1}
	jollakin c\in [x_0,x]\subset I. Jos on olemassa sellainen vakio M (indeksistä n riippumaton), että |f^{(n+1)}(x)|\le M kaikilla x\in I, niin 
		|E_n(x)|\le \frac{M}{(n+1)!}|x-x_0|^{n+1} \to 0,
	kun n\to\infty.


Todistus sivuutetaan (mathemaattinen induktio tai osittaisintegrointi).


Examples of Maclaurin polynomial approximations: \begin{align} \frac{1}{1-x} &\approx 1+x+x^2+\dots +x^n =\sum_{k=0}^{n}x^k\\ e^x&\approx 1+x+\frac{1}{2!}x^2+\frac{1}{3!}x^3+\dots + \frac{1}{n!}x^n =\sum_{k=0}^{n}\frac{x^k}{k!}\\ \ln (1+x)&\approx x-\frac{1}{2}x^2+\frac{1}{3}x^3-\dots + \frac{(-1)^{n-1}}{n}x^n =\sum_{k=1}^{n}\frac{(-1)^{k-1}}{k}x^k\\ \sin x &\approx x-\frac{1}{3!}x^3+\frac{1}{5!}x^5-\dots +\frac{(-1)^n}{(2n+1)!}x^{2n+1} =\sum_{k=0}^{n}\frac{(-1)^k}{(2k+1)!}x^{2k+1}\\ \cos x &\approx 1-\frac{1}{2!}x^2+\frac{1}{4!}x^4-\dots +\frac{(-1)^n}{(2n)!}x^{2n} =\sum_{k=0}^{n}\frac{(-1)^k}{(2k)!}x^{2k} \end{align}

Esimerkki

Kuinka mones Taylor-polynomi P_n(x) approksimoi funktiota \sin x välillä [-\pi,\pi] niin hyvin, että virheen itseisarvo on alle  10^{-6}?

Käytetään Taylorin kaavaa funktiolle f(x)=\sin x pisteen x_0=0 suhteen. Tällöin |f^{(n+1)}(c)|\le 1 riippumatta luvusta n ja pisteestä c. Lisäksi kyseisellä välillä on |x-x_0|=|x|\le \pi. Ehto toteutuu (ainakin silloin) kun 
		|E_n(x)|\le \frac{1}{(n+1)!}\pi^{n+1} < 10^{-6}.
	Tämä epäyhtälö täytyy ratkaista kokeilemalla luvun n eri arvoja; ratkaisuksi saadaan n\ge 16.

Vaadittu tarkkuus saadaan siis polynomilla P_{16}(x), joka on sinifunktion tapauksessa sama kuin P_{15}(x).

Kuvaajista tms. voi tarkistaa, ettei P_{13}(x) riitä vaadittuun tarkkuteen, joten teoreettinen raja on tarkka!

Taylorin polynomi ja ääriarvot


Jos f'(x_0)=0, niin myös osa korkeamman kertaluvun derivaatoista voi olla nollia: 
		f'(x_0)=f''(x_0)= \dots = f^{(n-1)}(x_0) =0,\ f^{(n)}(x_0) \neq 0.
	Tällöin funktion f käyttäytyminen pisteen x=x_0 lähellä määräytyy (vakiotermi f(x_0) ei vaikuta) Taylor-polynomin johtavasta termistä 
		\frac{f^{(n)}(x_0)}{n!}(x-x_0)^{n}.
	.

Tämä johtaa seuraavaan tulokseen:

Ääriarvot
  • Jos n on pariton, niin x_0 ei ole funktion f paikallinen ääriarvokohta.
  • Jos n on parillinen ja f^{(n)}(x_0)>0, niin funktiolla f on paikallinen minimi pisteessä x_0.
  • Jos n parillinen ja f^{(n)}(x_0), niin funktiolla f on paikallinen maksimi pisteessä x_0.

Newtonin menetelmä


The first Taylor polynomial P_1(x)=f(x_0)+f'(x_0)(x-x_0) is the same as the linearization of f at the point x_0. This can be used in some simple approximations and numerical methods.

Newtonin menetelmä

Yhtälö f(x)=0 voidaan ratkaista likimääräisesti valitsemalla jokin alkupiste x_0 (esimerkiksi kuvaajan perusteella) ja määrittelemällä lukujono palautuskaavalla 
	x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)}
	for n=0,1,2,\dots Tämä johtaa jonoon (x_0,x_1,x_2,\dots ), jonka termit approksimoivat yleensä funktion f nollakohtaa yhä paremmin indeksin n kasvaessa.


Palautuskaava perustuu geometriseen ideaan, jossa funktion nollakohtaa approksimoidaan sen tangenttisuoran nollakohdan avulla. Kyseessä on funktion linearisointi eli 1. asteen Taylor-polynomi edellisen pisteen x_n suhteen.

Esimerkki

Määritä luvun \sqrt{2} likiarvo Newtonin menetelmän avulla.

Käytetään Newtonin menetelmää funktiolle f(x)=x^2-2 ja alkuarvoa x_0=2. Palautuskaava tulee muotoon 
	x_{n+1}= x_n-\frac{x_n^2-2}{2x_n} = \frac{1}{2}\left(x_n+\frac{2}{x_n}\right),
	josta saadaan x_1=1{,}5, x_2\approx 1{,}41667, x_3\approx 1{,}4142157 jne.

Kokeilemalla huomataan (esim. Maple), että oikeiden desimaalien lukumäärä suunnilleen kaksinkertaistuu jokaisella askeleella, ja x_7 tuottaa yli 100 oikeaa desimaalia, kunhan välivaiheet lasketaan riittävällä tarkkuudella.

Taylor-sarja


Taylor-sarja

Jos Taylorin kaavan virhetermi E_n(x) lähestyy nollaa, kun n kasvaa, niin Taylor-polynomin raja-arvona saadaan Taylor-sarja f (= Maclaurin-sarja tapauksessa x_0=0).

Funktion f Taylor-sarja on muotoa 
		\sum_{k=0}^{\infty}\frac{f^{(k)}(x_0)}{k!}(x-x_0)^k 
		= \lim_{n\to\infty} \sum_{k=0}^{n}\frac{f^{(k)}(x_0)}{k!}(x-x_0)^k .
	Tämä on esimerkki potenssisarjasta.


Taylor-sarja voidaan muodostaa aina, kun funktiolla f on kaikkien kertalukujen derivaatat pisteessä x_0 ja nämä sijoitetaan ym. kaavaan. Tähän liittyy kuitenkin kaksi ongelmaa: 1. Suppeneeko Taylor-sarja kaikilla muuttujan arvoilla x?

Vastaus: Ei aina; esimerkiksi funktion 
	f(x)=\frac{1}{1-x}
	Maclaurin-sarja (= geometrinen sarja) suppenee vain arvoilla -1 < x < 1, vaikka alkuperäinen funktio on derivoituva  pisteissä x\neq 1: 
	f(x)=\frac{1}{1-x} = 1+x+x^2+x^3+x^4+\dots

Kokeile. Newtonin menetelmä. Valitse alkukohta x_{0} ja iteroi (monta kertaa) funktion nollakohdan likiarvon selvittämiseksi.
x_{0}=~

2. Jos sarja suppenee jollakin arvolla x, niin onko sarjan summa sama kuin f(x)? Vastaus: Ei aina; esimerkiksi funktiolle 
	f(x)=\begin{cases}
	e^{-1/x^2}, & x\neq 0,\\
	0, & x=0,\\
	\end{cases}
	pätee f^{(k)}(0)=0 kaikilla k\in \mathbf{N} (alkeellinen, mutta teknisesti hieman hankala lasku). Näin ollen sen Maclaurin-sarja on identtisesti nolla ja suppenee kohti arvoa f(x) vain kohdassa x=0.

Johtopäätös: Taylor-sarjoja pitäisi aina tutkia huolellisesti analysoimalla virhetermejä. Käytännössä voidaan kuitenkin usein käyttää tunnettuja sarjakehitelmiä apuna.

 
Funktion e^{-1/x^2} kuvaaja.
Esimerkkejä

\begin{align} \frac{1}{1-x} &= \sum_{k=0}^{\infty} x^k,\ \ |x|< 1 \\ e^x &= \sum_{k=0}^{\infty} \frac{1}{k!}x^k, \ \ x\in \mathbb{R} \\ \sin x &= \sum_{k=0}^{\infty} \frac{(-1)^{k}}{(2k+1)!} x^{2k+1}, \ \ x\in \mathbb{R} \\ \cos x &= \sum_{k=0}^{\infty} \frac{(-1)^{k}}{(2k)!} x^{2k},\ \ x\in \mathbb{R} \\ (1+x)^r &= 1+\sum_{k=1}^{\infty} \frac{r(r-1)(r-2)\dots (r-k+1)}{k!}x^k, |x|<1 \end{align} Viimeinen on nimeltään binomisarja ja se  voidaan muodostaa kaikilla r\in \mathbb{R}. Jos r=n \in \mathbb{N}, niin indeksistä k=n+1 alkaen kaikki kertoimet ovat nollia, ja alkuosassa 
	\binom{n}{k} =\frac{n!}{k!(n-k)!} = \frac{n(n-1)(n-2)\dots (n-k+1)}{k!}.

Vertaa binomikaavaan: 
	(a+b)^n=\sum_{k=0}^n\binom{n}{k} a^{n-k}b^k
	=a^n +na^{n-1}b+\dots +b^n,
	kun n\in\mathbb{N}.

Potenssisarja


Määritelmä: Potenssisarja

Potenssisarja on muotoa 
	\sum_{k=0}^{\infty} c_k(x-x_0)^k 
	= \lim_{n\to\infty} \sum_{k=0}^{n}c_k(x-x_0)^k.
	Piste x_0 on sarjan keskus luvut c_k ovat potenssisarjan kertoimet.

Sarja suppenee pisteessä x, jos ym. raja-arvo on olemassa ja äärellinen.

Suppenemisen suhteen on vain kolme olennaisesti erilaista tapausta:

Abelin lause.
  •  Sarja suppenee vain arvolla x=x_0 (jolloin siinä esiintyy pelkästään vakio c_0)
  •  Sarja suppenee kaikilla x\in \mathbb{R}
  •  Sarja supppenee jollakin välillä ]x_0-R,x_0+R[ (ja mahdollisesti yhdessä tai molemmissa päätepisteissä), ja hajaantuu muilla muuttujan x arvoilla.

Luku R on potenssisarjan suppenemissäde. Kahdessa ensimmäisessä tapauksessa merkitään R=0 tai R=\infty.

Esimerkki

Millä muuttujan x arvoilla potenssisarja \sum_{k=1}^{\infty} \frac{k}{2^k}x^k suppenee?

Käytetään suhdetestiä lausekkeelle a_k=kx^k/2^k. Silloin 
	\left| \frac{a_{k+1}}{a_k} \right| = 
	\left| \frac{(k+1)x^{k+1}/2^{k+1}}{kx^k/2^k} \right|
	= \frac{k+1}{2k}|x| \to \frac{|x|}{2},
	kun k\to\infty. Suhdetestin perusteella sarja suppenee, kun |x|/2, ja hajaantuu arvoilla |x|/2>1. Rajatapauksissa |x|/2= 1\Leftrightarrow x=\pm 2 sarjan yleinen termi ei lähesty nollaa, joten sarja hajaantuu.

Tulos: Sarja suppenee arvoilla -2< x< 2, ja hajaantuu muuten.

Määritelmä: Summafunktio

Sarjan suppenemisvälillä I voidaan määritellä funktio f\colon I\to \mathbb{R} asettamalla \begin{equation} \label{summafunktio} f(x) = \sum_{k=0}^{\infty} c_k(x-x_0)^k, \tag{1} \end{equation} jota kutsutaan potenssisarjan summafunktioksi.

Summafunktio f on jatkuva ja derivoituva avoimella välillä ]x_0-R,x_0+R[. Lisäksi derivaatta f'(x) voidaan laskea derivoimalla potenssisarja termeittäin: 
	f'(x)=\sum_{k=1}^{\infty}kc_k(x-x_0)^{k-1}.
	Huom. Vakiotermi c_0 häviää derivoinnissa, joten summaus alkaa kohdasta k=1. Derivoitu sarja suppenee samalla välillä x\in \, ]x_0-R,x_0+R[ kuin alkuperäinen potenssisarja; tämä voi tuntua hieman yllättävältä kertoimen k vuoksi.

Esimerkki

Määritä potenssisarjan 1+2x+3x^2+4x^3+\dots summafunktio.

Tämä sarja saadaan derivoimalla termeittäin geometrinen sarja (kun q=x). Näin ollen \begin{align} 1+2x+3x^2+4x^3+\dots &= D(1+x+x^2+x^3+x^4+\dots ) \\ &= \frac{d}{dx}\left( \frac{1}{1-x}\right) = \frac{1}{(1-x)^2}. \end{align} Kerrotaan molemmat puolet termillä x, jolloin saadaan 
	\sum_{k=1}^{\infty}kx^{k} = x+2x^2+3x^3+4x^4+\dots = \frac{x}{(1-x)^2},
	joka on voimassa arvoilla |x|.

Tapauksessa [a,b]\subset\ ]x_0-R,x_0+R[ sarjan voi myös integroida termeittäin: 
	\int_a^b f(x)\, dx = \sum_{k=0}^{\infty}c_k\int_a^b (x-x_0)^k\, dx.
	Usein integroinnin voi ulottaa myös sarjan suppenemisvälin päätepisteeseen saakka, mutta tämä ei pidä paikkaansa yleisesti.

Esimerkki

Lasketaan vuorottelevan harmonisen sarjan summa.

 Sijoitetaan aluksi q=-x geometrisen sarjan summakaavaan. Näin saadaan 
	1-x+x^2-x^3+x^4-\dots =\frac{1}{1-(-x)} = \frac{1}{1+x}.
	Integroidaan yhtälön molemmat puolet pisteestä x=0 pisteeseen x=1, jolloin saadaan 
	1-\frac{1}{2}+\frac{1}{3}-\frac{1}{4}+\dots =\int_0^1\frac{1}{1+x} =\ln 2.
	Huom. Integroinnin ulottaminen pisteeseen x=1 saakka pitäisi perustella tarkemmin. Integrointiin palataan myöhemmin tällä kurssilla.

'; } else { return ''; } } ], { useMathJax : true, fontSize : 14 }); function iterate(){ var x = 0; if(i>10){ return; } if(i==0){ x = document.getElementById("x0").value; if(isNaN(x) || x==""){ alert("Invalid input"); return; } x = Number(x); document.getElementById("x0").disabled = true; } else{ x = points[i-1].X(); } var fx = f(x); slope = derivative(x); var intersection = fx - slope*x; segments[i] = board.create('segment',[[x,0],[x,fx]],{ dash : 1, highlight : false, strokeOpacity : .6, strokeWidth : 1.5, strokeColor : '#32a889' }); tangents[i] = board.create('line',[[x, fx],[x+1, slope+fx]],{ fixed : true, highlight : false, strokeOpacity : .6, strokeWidth : 1.5, strokeColor : '#32a889' }); points[i] = board.create('point',[-intersection/slope,0],{ fixed : true, highlight : false, showInfobox : false, strokeWidth : 1, strokeColor : 'black', fillColor : '#7732a8', name : 'x_{' + (i+1) + '}', label : { useMathJax : true } }); board.update(); i++; } function reset(){ i = 0; document.getElementById("x0").disabled = false; document.getElementById("x0").value = ""; board.removeObject(points), board.removeObject(segments), board.removeObject(tangents); points = [], segments = [], tangents = []; board.fullUpdate(); } document.getElementById("iterate").onclick = iterate; document.getElementById("reset").onclick = reset; board.fullUpdate(); })();

6. Elementary functions

This chapter gives some background to the concept of a function. We also consider some elementary functions from a (possibly) new viewpoint. Many of these should already be familiar from high school mathematics, so in some cases we just list the main properties.

Functions


Definition: Function

A function f\colon A\to B is a rule that determines for each element a\in A exactly one element b\in B. We write b=f(a).


Definition: Domain and codomain

In the above definition of a function A=D_f is the domain (of definition) of the function f and B is called the codomain of f.


Definition: Image of a function

The image of f is the subset f[A]= \{ f(a) \mid a\in A\} of B. An alternative name for image is range.


For example, f\colon \mathbb{R}\to\mathbb{R}, f(x)=x^2, has codomain \mathbb{R}, but its image is f[\mathbb{R} ] =[0,\infty[.

The function in the previous example can also be defined as f\colon \mathbb{R}\to [0,\infty[, f(x)=x^2, and then the codomain is the same as the image. In principle, this modification can always be done, but it is not reasonable in practice.

Example: Try to do the same for f\colon \mathbb{R}\to\mathbb{R}, f(x)=x^6+x^2+x, x\in\mathbb{R}.

  • If the domain A\subset \mathbb{R} then f is a function of one (real) variable: the main object of study in this course.

  • If A\subset \mathbb{R}^n, n\ge 2, then f is a function of several variables (a multivariable function)

Inverse functions


Definition: Injection, surjection and bijection
A function f\colon A \to B is
  • injective (one-to-one) if it has different values at different points; i.e. x_1\neq x_2 \Rightarrow f(x_1)\neq f(x_2), or equivalently f(x_1)= f(x_2) \Rightarrow x_1=x_2.
  • surjective (onto) if its image is the same as codomain, i.e. f[A]=B
  • bijective (one-to-one and onto) if it is both injective and surjective.

Observe: A function becomes surjective if all redundant points of the codomain are left out. A function becomes injective if the domain is reduced so that no value of the function is obtained more than once.

Another way of defining these concepts is based on the number of solutions to an equation:

Definition

For a fixed y\in B, the equation y=f(x) has

  • at most one solution x\in A if f is injective
  • at least one solution x\in A if f is surjective
  • exactly one solution x\in A if f on bijective.

Definition: Inverse function

If f\colon A \to B is bijective, then it has an inverse f^{-1}\colon B \to A, which is uniquely determined by the condition y=f(x) \Leftrightarrow x = f^{-1}(y).


The inverse satisfies f^{-1}(f(a))=a for all a\in A and f(f^{-1}(b))=b for all b\in B.

The graph of the inverse is the mirror image of the graph of f with respect to the line y=x: A point (a,b) lies on the graph of f \Leftrightarrow b=f(a) \Leftrightarrow a=f^{-1}(b) \Leftrightarrow the point (b,a) lies on the graph of f^{-1}. The geometric interpretation of (a,b)\mapsto (b,a) is precisely the reflection with respect to y=x.

If A \subset \mathbb{R} and f\colon A\to \mathbb{R} is strictly monotone, then the function f\colon A \to f[A] has an inverse.

If here A is an interval and f is continuous, then also f^{-1} is is continuous in the set f[A].

Theorem: Derivative of the inverse

Let f\colon \, ]a,b[\, \to\, ]c,d[ be differentiable and bijective, so that it has an inverse f^{-1}\colon \, ]c,d[\, \to\, ]a,b[. As the graphs y=f(x) and y=f^{-1}(x) are mirror images of each other, it seems geometrically obvious that also f^{-1} is differentiable, and we actually have 
	\left(f^{-1}\right)'(x)=\frac{1}{f'(f^{-1}(x))},
	if f'(f^{-1}(x))\neq 0.

Proof.

Differentiate both sides of the equation \begin{align} f(f^{-1}(x)) &= x \\ \Rightarrow f'(f^{-1}(x))\left(f^{-1}\right)'(x) &= Dx = 1, \end{align} and solve for \left(f^{-1}\right)'(x).

\square

Note. f'(f^{-1}(x)) is the derivative of f at the point f^{-1}(x).

one-to-one
1. f\colon A\to B is one-to-one but not onto

onto
2. f\colon A\to B is onto but not one-to-one

one-to-one and onto
3. f\colon A\to B is one-to-one and onto

Transcendental functions


Trigonometric functions


  • Unit of measurement of an angle = rad: the arclength of the arc on the unit circle, that corresponds to the angle.

  • \pi rad = 180 degrees, i.e. 1 rad = 180/\pi \approx 57,\! 3 degrees

  • The functions \sin x, \cos x are defined in terms of the unit circle so that (\cos x,\sin x), x\in [0,2\pi], is the point on the unit circle corresponding to the angle x\in\mathbb{R}, measured counterclockwise from the point (1,0). \tan x = \frac{\sin x}{\cos x}\ (x\neq \pi /2 +n\pi), \cot x = \frac{\cos x}{\sin x}\ (x\neq n\pi)

  • Periodicity: \sin (x+2\pi) = \sin x,\ \cos (x+2\pi)=\cos x, \tan (x+\pi) = \tan x

  • Basic properties (from the unit circle!)
  • \sin 0 = 0, \sin (\pi/2)=1

  • \cos 0=1, \cos (\pi/2)= 0

  • Parity: \sin and \tan are odd functions, \cos is an even function: \sin (-x) = -\sin x, \cos(-x)  = \cos x, \tan (-x) = -\tan x.

  • \sin^2 x + \cos^2 x = 1 for all x\in\mathbb{R}

    Proof: Pythagorean Theorem.

  • Addition formulas:

    \sin (x+y) = \sin x \cos y +\cos x \sin y

    \cos (x+y) = \cos x \cos y -\sin x \sin y

  • Proof: Geometrically, or more easily with vectors and matrices.

    Derivatives: 
	D(\sin x) = \cos x,\ \ D(\cos x) = -\sin x

Interactivity. The connection between the unit circle and the trigonometric functions.
Example

It follows that the functions y(t)=\sin (\omega t) and y(t)=\cos (\omega t) satisfy the differential equation 
	y''(t)+\omega^2y(t)=0,
	that models harmonic oscillation. Here t is the time variable and the constant \omega>0 is the angular frequency of the oscillation. We will see later that all the solutions of this differential equation are of the form 
	y(t)=A\cos (\omega t) +B\sin (\omega t),
	with A,B constants. They will be uniquely determined if we know the initial location y(0) and the initial velocity y'(0). All solutions are periodic and their period is T=2\pi/\omega.

Harmonic oscillator y(t) = y_{0}\cos(\omega t),
where t is the elapsed time in seconds

Arcus functions


The trigonometric functions have inverses if their domain and codomains are chosen in a suitable way.

  • The Sine function 
	\sin \colon [-\pi/2,\pi/2]\to [-1,1]
	is strictly increasing and bijective.

  • The Cosine function 
	\cos \colon [0,\pi] \to [-1,1]
	is strictly decreasing and bijective.

  • The tangent function 
	\tan \colon ]-\pi/2,\pi/2[\, \to \mathbb{R}
	is strictly increasing and bijective.

Arcus functions

Inverses: \arctan \colon \mathbb{R}\to \ ]-\pi/2,\pi/2[, \arcsin \colon [-1,1]\to [-\pi/2,\pi/2], \arccos \colon [-1,1]\to [0,\pi]

This means: x = \tan \alpha \Leftrightarrow \alpha = \arctan x \ \ \text{for } \alpha \in \ ]-\pi/2,\pi/2[ x = \sin \alpha \Leftrightarrow \alpha = \arcsin x \ \ \text{for } \alpha \in \, [-\pi/2,\pi/2] x = \cos \alpha \Leftrightarrow \alpha = \arccos x \ \ \text{for } \alpha \in \, [0,\pi]

Note. Values of the arcus functions should be given in radians, unless we are considering some geometrical applications.

The graphs of \tan and \arctan.

Derivatives of the arcus functions

D \arctan x = \frac{1}{1+x^2},\ x\in \mathbb{R} \tag{1} D\arcsin x = \frac{1}{\sqrt{1-x^2}},\ -1 < x < 1 \tag{2} D\arccos x =  \frac{-1}{\sqrt{1-x^2}},\ -1 < x < 1 \tag{3}

Note. The first result is very useful in integration.

Proof.

Here we will only prove the first result (1). By differentiating both sides of the equation \tan(\arctan x)=x for x\in \mathbb{R}: \bigl( 1+\tan^2(\arctan x)\bigr) \cdot D(\arctan x) = D x = 1 \Rightarrow  D(\arctan x)= \frac{1}{1+\tan^2(\arctan x)} =\frac{1}{1+x^2}.

The last row follows also directly from the formula for the derivative of an inverse.

Example

Show that 
		\arcsin x +\arccos x =\frac{\pi}{2}
	for -1\le x\le 1.

Example

Derive the addition formula for tan, and show that 
	\arctan x+\arctan y = \arctan \frac{x+y}{1+xy}.

Solutions: Voluntary exercises. The first can be deduced by looking at a rectangular triangle with the length of the hypotenuse equal to 1 and one leg of length x.

Introduction: Radioactive decay

Let y(t) model the number of radioactive nuclei at time t. During a short time interval \Delta t the number of decaying nuclei is (approximately) directly proportional to the length of the interval, and also to the number of nuclei at time t: 
	\Delta y = y(t+\Delta t)-y(t) \approx -k\cdot y(t)\cdot \Delta t.
	The constant k depends on the substance and is called the decay constant. From this we obtain 
	\frac{\Delta y}{\Delta t} \approx -ky(t),
	and in the limit as \Delta t\to 0 we end up with the differential equation y'(t)=-ky(t).

Exponential function


Definition: Euler's number

Euler's number (or Napier's constant) is defined as e = \lim_{n\to \infty} \left( 1+\frac{1}{n}\right) ^n = 1+1+\frac{1}{2!}+\frac{1}{3!} +\frac{1}{4!}
	+\dots \approx 2,\! 718281828459\dots


Definition: Exponential function

The Exponential function exp: 
	\exp (x) = \sum_{k=0}^{\infty} \frac{x^k}{k!}=
	\lim_{n\to \infty} \left( 1+\frac{x}{n}\right) ^n = e^x.
	This definition (using the series expansion) is based on the conditions \exp'(x)=\exp(x) and \exp(0)=1, which imply that \exp^{(k)}(0)=\exp(0)= 1 for all k\in\mathbb{N}, so the Maclaurin series is the one above.


The connections between different expressions are surprisingly tedious to prove, and we omit the details here. The main steps include the following:

  • Define \exp\colon\mathbb{R}\to\mathbb{R}, 
	\exp (x) =\sum_{k=0}^{\infty}\frac{x^k}{k!}.
	This series converges for all x\in\mathbb{R} (ratio test).

  • Show: exp is differentiable and satisfies \exp'(x)=\exp(x) for all x\in \mathbb{R}. (This is the most difficult part but intutively rather obvious, because in practice we just differentiate the series term by term like a polynomial.)

  • It has the following properties \exp (0)=1, 
	\exp (-x)=1/\exp (x) \text{ and }
	\exp (x+y)=\exp (x)\,  \exp(y)
	for all x,y\in \mathbb{R}.

    These imply that \exp (p/q)=(\exp (1))^{p/q} for all rational numbers p/q\in \mathbf{Q}.

    By continuity 
	\exp (x) =(\exp (1))^x
	for all x\in \mathbb{R}.

    Since 
	\exp (1) = \sum_{k=0}^{\infty}\frac{1}{k!}
	=\lim_{n\to \infty} \left( 1+\frac{1}{n}\right) ^n=e,
	we obtain the form e^x.

    \square?

Corollary

It follows from above that \exp\colon\mathbb{R}\to\, ]0,\infty[ is strictly increasing, bicective, and 
	\lim_{x\to\infty}\exp(x) = \infty,\ 
	\lim_{x\to-\infty}\exp(x) = 0,\
	\lim_{x\to\infty}\frac{x^n}{\exp (x)} = 0 \text{ for all } n\in \mathbf{N}.


From here on we write e^x=\exp(x). Properties:

  • e^0 = 1
  • e^x >0
  • D(e^x) = e^x
  • e^{-x} = 1/e^x
  • (e^x)^y = e^{xy}
  • e^xe^y =e^{x+y}
for all x,y\in \mathbb{R}.

Differential equation y'=ky

Theorem

Let k\in\mathbb{R} be a constant. All solutions y=y(x) of the ordinary differenial equation (ODE) 
	y'(x)=ky(x),\ x\in \mathbb{R},
	are of the form y(x)=Ce^{kx}, where  C is a constant. If we know the value of y at some point x_0, then the constant C will be uniquely determined.

Proof.

Suppose that y'(x)=ky(x). Then D(y(x)e^{-kx})= y'(x)e^{-kx}+y(x)\cdot (-ke^{-kx}) = ky(x)e^{-kx}-ky(x)e^{-kx}=0 for all x\in\mathbf{R}, so that y(x)e^{-kx}=C= constant. Multiplying both sides with e^{kx} we obtain y(x)=Ce^{kx}.

\square

Euler's formula

Definition: Complex numbers

Imaginary unit i: a strange creature satisfying i^2=-1. The complex numbers are of the form z=x+iy, where x,y\in \mathbb{R}. We will return to these later.


Theorem: Euler's formula

If we substitute ix as a variable in the expontential fuction, and collect real terms separately, we obtain Euler's formula e^{ix}=\cos x+i\sin x.

Proof.

Substitute x=ix in the definition of the exponential function and write the series as the sum of its even (n=2k) and odd (n=2k+1) parts. Note that i^{2k} = (i^2)^k = (-1)^{k} and remember the Taylor series of the trigonometric functions.

\square

As a special case we have Euler's identity e^{i\pi}+1=0. It connects the most important numbers 0, 1, i, e ja \pi and the three basic operations sum, multiplication, and power.

Using e^{\pm ix}=\cos x\pm i\sin x we can also derive the expressions 
	\cos x=\frac{1}{2}\bigl( e^{ix}+e^{-ix}\bigr),\
	\sin x=\frac{1}{2i}\bigl( e^{ix}-e^{-ix}\bigr),
	\ x\in\mathbb{R}.

The graphs of \exp(x) and the partial sums \displaystyle\sum_{k=0}^{n}\frac{x^{k}}{k!}

Logarithms


Definition: Natural logarithm

Natural logarithm is the inverse of the exponential function: 
	\ln\colon \ ]0,\infty[ \ \to \mathbb{R}


Note. The general logarithm with base a is based on the condition 
	a^x = y \Leftrightarrow x=\log_a y
	for a>0 and y>0.

Beside the natural logarithm, in applications also appear the Briggs logarithm with base 10: \lg x = \log_{10} x, and the binary logarithm with base 2: {\rm lb}\, x =\log_{2} x.

Usually (e.g. in mathematical software) \log x is the same as \ln x.

Properties of the logarithm:

  • e^{\ln x} = x for x>0
  • \ln (e^x) =x for x\in\mathbb{R}
  • \ln 1=0, \ln e = 1
  • \ln (a^b) = b\ln a if a>0, b\in\mathbb{R}
  • \ln (ab) = \ln a+\ln b, if a,b>0
  • D\ln |x|=1/x for x\neq 0
  • These follow from the corresponding properties of exp.

    Example

    Substituting x=\ln a and y=\ln b to the formula

    e^xe^y =e^{x+y} we obtain ab =e^{\ln a+\ln b},

    so that \ln (ab) = \ln a +\ln b.

The graph of \ln

Hyperbolic functions


Definition: Hyperbolic functions

Hyperbolic sine sinus hyperbolicus \sinh, hyperbolic cosine cosinus hyperbolicus \cosh and hyperbolic tangent \tanh are defined as \sinh \colon \mathbb{R}\to\mathbb{R}, \ \sinh x=\frac{1}{2}(e^x-e^{-x}) \cosh \colon \mathbb{R}\to [1,\infty[,\ \cosh x=\frac{1}{2}(e^x+e^{-x}) \tanh \colon \mathbb{R}\to \ ]-1,1[, \ \tanh x =\frac{\sinh x}{\cosh x}


Properties: \cosh^2x-\sinh^2x=1; all trigonometric have their hyperbolic counterparts, which follow from the properties \sinh (ix)=i\sin x, \cosh (ix)=\cos x. In these formulas, the sign of \sin^2 will change, but the other signs remain the same.

Derivatives: D\sinh x=\cosh x, D\cosh x=\sinh x.

Hyperbolic inverse functions: the so-called area functions; area and the shortening ar refer to a certain geometrical area related to the hyperbola x^2-y^2=1: \sinh^{-1}x=\text{arsinh}\, x=\ln\bigl( x+\sqrt{1+x^2}\, \bigr) ,\ x\in\mathbb{R} \cosh^{-1}x=\text{arcosh}\, x=\ln\bigl( x+\sqrt{x^2-1}\, \bigr) ,\ x\ge 1

Derivatives of the inverse functions: D \sinh^{-1}x= \frac{1}{\sqrt{1+x^2}} ,\ x\in\mathbb{R} D \cosh^{-1}x= \frac{1}{\sqrt{x^2-1}} ,\ x > 1.

The graph of \cosh
The graph of \sinh
The graph of \tanh
'; }], { useMathJax : true, anchor : g, fixed : true }); var s1 = board.create('segment', [[0, 0], [1, 0]], { fixed : true, highlight : false, dash : 2, strokeWidth : 2, strokeColor : 'black' }); var s2 = board.create('segment', [[0, 0], function() { return [g.X(), g.Y()]; }], { fixed : true, highlight : false, dash : 2, strokeWidth : 2, strokeColor : 'black' }); var x = board.create('angle', [s1, s2, 1, 1], { name : 'x', radius : .4, label : { useMathJax : true, strokeColor : 'black', offset : [0, .5] } }); var info = board.create('text', [-1.2, -1.25, function() { return '(\\cos x,\\sin x)=(' + Math.cos(x.Value()).toFixed(3) + ',' + Math.sin(x.Value()).toFixed(3) + ')'; }], { useMathJax : true, fixed : true }); board.fullUpdate(); })();

7. Pinta-ala

Pinta-ala tasossa


Tarkastellaan umpinaisen ja itseään leikkaamattoman tasokäyrän raamien alueiden pinta-alaa. Pinta-alan yleinen käsite on teoreettisesti paljon hankalampi, mistä antaa viitteen luvun lopussa oleva huomautus.

Tasojoukon pinta-ala määritellään palauttamalla se yksinkertaisempien joukkojen pinta-aloihin. Erityisesti täytyy huomata, ettei pinta-alaa voi "laskea", ellei "pinta-alan" käsitettä ole ensin määritelty (vaikka koulumatematiikassa näin usein tehdäänkin).

Lähtökohta

Suorakulmion pinta-ala
Suorakulmion pinta-ala on kanta \times korkeus: A=ab.

rectangle
Määritelmä: Suunnikkaan pinta-ala

Suunnikkaan pinta-ala on kanta \times korkeus: 
		 A=ah.


parallelogram
Määritelmä: Kolmion pinta-ala

Kolmion pinta-ala on (määritelmän mukaan) 
		 A=\frac{1}{2}ah.


triangle

Monikulmio

(Yksinkertainen) monikulmio on tasojoukko, jota rajaa äärellisestä määrästä peräkkäisiä janoja koostuva suljettu käyrä. Vain peräkkäiset janat saavat leikata toisiaan yhteisessä päätepisteessä.

polygon
Määritelmä: Monikulmion pinta-ala

Monikulmion pinta-ala määritellään jakamalla se äärelliseen määrään kolmioita (monikulmion kolmiointi) ja laskemalla kolmioiden pinta-alat yhteen.


triangulation
Lause.

Kolmioiden pinta-alojen summaf  ei riipu monikulmion kolmioinnin valinnasta.


Yleinen tapaus

Tasojoukolle \color{red} D, jota rajaa umpinainen itseään leikkaamaton käyrä, voidaan muodostaa sisämonikulmioita \color{blue}P_i ja ulkomonikulmioita P_o: \color{blue}P_i\color{black} \subset \color{red}D\color{black}\subset P_o.

Rajoitetulla tasojoukolla D on pinta-ala, jos jokaista \varepsilon >0 vastaa sisämonikulmio P_i ja ulkomonikulmio P_o, joiden pinta-alat poikkeavat toisistaan vähemmän kuin \varepsilon: 
	A(P_o)-A(P_i) Tästä seuraa, että kaikkien lukujen A(P_i) ja kaikkien lukujen A(P_o) välissä on yksikäsitteinen luku A(D), joka on määritelmän mukaan joukon D pinta-ala.

Inner and outer polygons

Yllätys: Se, että joukkoa D rajoittaa umpinainen (itseään leikkaamaton) käyrä, ei takaa, että joukon pinta-ala on määritelty: Reunakäyrä voi olla niin "mutkitteleva", että sillä on positiivinen "pinta-ala". Ensimmäisen esimerkin konstruoi [W.F. Osgood, 1903]:

Wikipedia: Osgood curve

Esimerkki

Johda R-säteisen ympyrän pinta-alan kaava A=\pi R^2 valitsemalla sisä- ja ulkomonikulmioiksi säännöllisiä n-kulmioita, ja ottamalla lopuksi raja-arvo n\to\infty.

Ratkaisu: vapaaehtoinen lisätehtävä, jossa tarvitaan raja-arvoa \lim_{x\to 0}\frac{\sin x}{x} = 1. Vihje: Osoita, että säännöllisten sisä- ja ulkomonikulmioiden pinta-alat ovat 	\pi R^2\frac{\sin (2\pi/n)}{2\pi/n} \ \text{ ja }\ \pi R^2\frac{\tan \pi/n}{\pi/n}.

8. Integral

From sum to integral


Definite integral

Geometric interpretation: Let f\colon[a,b]\to\mathbb{R} be such that f(x)\ge 0 for all x\in[a,b]. How can we find the area of the region bounded by the function graph y=f(x), the x-axis and the two lines x=a and x=b?

The answer to this question is given by the definite integral \int_{a}^{b}f(x)\,dx Remark. The general definition of the integral does not necessitate the condition f(x)\ge 0.

Integration of continuous functions

Definition: Partition

Let f\colon[a,b]\to\mathbb{R} be continuous. A finite sequence D=(x_{0},x_{1},x_{2},\dots,x_{n}) of real numbers such that a=x_{0} < x_{1} < x_{2} < \dots < x_{n} = b is called a partition of the interval [a,b].


Geometric interpretation of the definite integral of f from x=a to x=b
Definition: Upper and lower sum

For each partition D we define the related upper sum of the function f as U_{D}(f) = \sum_{k=1}^{n}M_{k}(x_{k}-x_{k-1}),~M_{k} = \max\{f(x)\mid x_{k-1}\le x\le x_{k}\} and the lower sum as L_{D}(f) = \sum_{k=1}^{n}m_{k}(x_{k}-x_{k-1}),~m_{k}=\min\{f(x)\mid x_{k-1}\le x\le x_{k}\}.


If f is a positive function then the upper sum represents the total area of the rectangles circumscribing the function graph and similarly the lower sum is the total area of the inscribed rectangles.

Properties of partitions
  1. Suppose that D_{1} and D_{2} are two partitions of a given interval such that D_{1} is a subsequence of D_{2} (i.e. D_{2} is finer than D_{1}). Then the inequalities

    U_{D_1}(f) \ge U_{D_{2}}(f)~ and ~L_{D_{1}}(f) \le L_{D_{2}}(f)

    always hold.
  2. For any two partitions D_{1} and D_{2} of a given interval the inequality  L_{D_{2}}(f) \le U_{D_{1}}(f) always holds.

Interactive.

f(x)=~

Upper Darboux sumLower Darboux sum
Definition: Integrability

We say that a function f\colon[a,b]\to\mathbb{R} is integrable if for every \epsilon>0 there exists a corresponding partition D of [a,b] such that  U_{D}(f) - L_{D}(f) < \epsilon.


Definition: Integral

Integrability implies that there exists a unique real number I such that L_{D}(f)\le I\le U_{D}(f) for every partition D. This is called the integral of f over the interval [a,b] and denoted by  I = \int_{a}^{b}f(x)\,dx.


Remark. This definition of the integral is sometimes referred to as the Darboux integral.

For non-negative functions f this definition of the integral coincides with the idea of making the difference between the the areas of the circumscribed and the inscribed rectangles arbitrarily small by using ever finer partitions.

Theorem.

A continuous function on a closed interval is integrable.

Proof.

Here we will only provide the proof for continuous functions with bounded derivatives.

Suppose that f\colon[a,b]\to\mathbb{R} is a continuous function and that there exists a constant L>0 such that |f'(x)|\le L for all x\in]a,b[. Let \epsilon>0 and define D to be an equally spaced partition of [a,b] such that \underbrace{|x_{k}-x_{k-1}|}_{=\Delta x} < \frac{\epsilon}{L(b-a)},~\text{for all} k=1,2,\dots,n. Let f(y_{k})=m_{k} and f(z_{k})=M_{k} for some suitable points y_{k},z_{k}\in[x_{k-1},x_{k}]. The mean value theorem then states that M_{k}-m_{k}=f'(c_{k})|z_{k}-y_{k}|\le L\Delta x and thus U_{D}(f)-L_{D}(f) = \sum_{k=1}^{n}(M_{k}-m_{k})\Delta x < \frac{\epsilon}{b-a}\sum_{k=1}^{n}\Delta x = \epsilon.

\square


Definition: Riemann integral

Suppose that f\colon[a,b]\to\mathbb{R} is a continuous function and let (x_{0},x_{1},\dots,x_{n}) be a partition of \left[a,b\right] and (z_{1},z_{2},\dots,z_{n}) be a sequence of real numbers such that z_{k}\in[x_{k-1},x_{k}] for all 1\le k\le n. The partial sums 	S_{n} = \sum_{k=1}^{n}f(z_{k})\Delta x_{k},~\text{where}
	  ~\Delta x_{k}=x_{k}-x_{k-1} are called the Riemann sums of f. Suppose further that the partitions are such that \displaystyle\max_{1\le k\le n}\Delta x_{k}\to 0 as n\to\infty. The integral of f can then be defined as the limit 	\int_{a}^{b}f(x)\,\mathrm{d}x = \lim_{n\to\infty} S_{n}.	This definition of the integral is called the Riemann integral.

Remark. This definition of the integral turns out to be equivalent to that of the Darboux integral i.e. a function is Riemann-integrable if and only if it is Darboux-integrable and the values of the two integrals are always equal.

Example

Find the integral of f(x)=x over the interval [0,1] using Riemann sums.

Let x_{k}=k/n. Then x_{0}=0, x_{n}=1 and x_{k} < x_{k+1} for all 0\le k\le n. Thus the sequence (x_{0},x_{1},x_{2},\dots,x_{n}) is a proper partition of \left[0,1\right]. This partition has the pleasant property hat \Delta x=1/n is a constant. Estimating the Riemann sums we now find that \sum_{k=1}^{n}f(x_{k})\Delta x = \sum_{k=1}^{n}x_{k}\Delta x= 
	\sum_{k=1}^{n}\frac{k}{n}\left(\frac{1}{n}\right) = \frac{1}{n^2}\sum_{k=1}^{n}k = \frac{1}{n^2}\frac{n(n+1)}{2} = \frac{n+1}{2n}\to 
	\frac{1}{2}, as n\to\infty and hence \int_{0}^{1}f(x)\,\mathrm{d}x = \frac{1}{2}.

This is of course the area of the triangular region bounded by the line y=x, the x-axis and the lines x=0 and x=1.

Remark. Any interval [a,b] can be partitioned into equally spaced subintervals by setting \Delta x = (b-a)/n and x_{k} = a + k\Delta x.

Conventions
  1. If the upper and lower limits of integration are the same then the integral is zero:  \int_{a}^{a}f(x)\,dx = 0.
  2. Reversing the limits of integration changes the sign of the integral:  \int_{b}^{a}f(x)\,dx = -\int_{a}^{b}f(x)\,dx.
  3. It also follows that  \int_{a}^{b}f(x)\,dx = \int_{a}^{c}f(x)\,dx + \int_{c}^{b}f(x)\,dx holds for all a,b,c\in\mathbb{R}.

Piecewise-defined functions

Definition: Piecewise continuity

A function f\colon\left[a,b\right]\to\mathbb{R} is called piecewise continuous if it is continuous except at a finite number of points a\le c_{1} < c_{2} < \dots < c_{m} \le b and the one-sided limits of the function are defined and bounded on each of these points. It follows that the restriction of f on each subinterval \left[c_{k-1},c_{k}\right] is continuous if the one-sided limits are taken to be the values of the function at the end points of the subinterval.


Definition: Piecewise integration

Let f\colon\left[a,b\right] be a piecewise continuous function. Then \int_{a}^{b}f(x)\,dx = \sum_{k=1}^{m+1}\int_{c_{k-1}}^{c_{k}}f(x)\,dx, where a=c_{0}< c_{1} < \dots < c_{m+1} = b and f is thought as a continuous function on each subinterval \left[c_{k-1},c_{k}\right]. Usually functions which are continuous yet piecewise defined are also integrated using the same idea.


Example

Consider the function f\colon\left[-1,1\right] defined as 
	f(x) =
	\begin{cases}
	-1 &\text{ for }-1\le x We can now integrate f as follows: 
	\int_{-1}^{1}f(x)\,dx = \int_{-1}^{0}f(x)\,dx + \int_{0}^{1}f(x)\,dx
	
	=\int_{-1}^{0}(-1)\,dx + \int_{0}^{1}1\,dx = -1\cdot(-1-0) + 1\cdot(1-0) = 2.

Integral of the function f(x) =\begin{cases}
	-1 &\text{ for }-1\le x

Important properties


Properties

Suppose that f,g\colon\left[a,b\right]\to\mathbb{R} are piecewise continuous functions. The integral has the following properties

  1. Linearity: If c_{1},c_{2}\in\mathbb{R} then \int_{a}^{b}\big(c_{1}f(x)+c_{2}g(x)\big)\,\mathrm{d}x = c_{1}\int_{a}^{b}f(x)\,\mathrm{d}x+c_{2}\int_{a}^{b}g(x)\,\mathrm{d}x.
  2. If h(x)\ge 0 for all x\in[a,b] then \int_{a}^{b}h(x)\,\mathrm{d}x \ge 0.
  3. If f(x)\le g(x) then \int_{a}^{b}f(x)\,\mathrm{d}x \le \int_{a}^{b}g(x)\,\mathrm{d}x.
  4. As f(x)\le|f(x)| it follows that \int_{a}^{b}f(x)\,\mathrm{d}x \le \int_{a}^{b}|f(x)|\,\mathrm{d}x and taking the absolute value of both sides of the equation gives \left|\int_{a}^{b}f(x)\,\mathrm{d}x\right|\le \int_{a}^{b}|f(x)|\,\mathrm{d}x.
  5. Suppose that p=\inf_{x\in\left[a,b\right]}f(x) and s=\sup_{x\in\left[a,b\right]}f(x). Then p(b-a)\le \int_{a}^{b}f(x)\,dx \le s(b-a).

Fundamental theorem of calculus


Theorem: Mean value theorem

Let f\colon[a,b]\to\mathbb{R} be a continuous function. Then there exists c\in(a,b) such that  f(c)=\frac{1}{b-a}\int_{a}^{b}f(x)\,\mathrm{d}x. This is the mean value of f on the interval [a,b] and we denote it with \overline{f}.

Proof.

Suppose that m and M are the minimum and maximum of f on the interval [a,b], respectively. It follows that  m(b-a)\le \int_{a}^{b}f(x)\,\mathrm{d}x\le M(b-a) or m\le \frac{1}{b-a}\int_{a}^{b}f(x)\,\mathrm{d}x\le M\quad \Leftrightarrow\quad m\le \overline{f}\le M. Thus \overline{f} is between the minimum and maximum of a continuous function f and by the intermediate value theorem it must be that f(c)=\overline{f} for some c\in\,]a,b[.

\square


(First) Fundamental theorem of calculus.

Let f\colon[a,b]\to\mathbb{R} be a continuous function. Then  \frac{\mathrm{d}}{\mathrm{d}x}\int_{a}^{x}f(t)\,\mathrm{d}t = f(x) for all x\in\,]a,b[.

Proof.

Let  F(x) = \int_{a}^{x}f(t)\,\mathrm{d}t. The mean value theorem implies that there exists c\in\,[x,x+h] such that  \frac{F(x+h)-F(x)}{h} = \frac{1}{h}\left(\int_{a}^{x+h}f(t)\,
	\mathrm{d}t-\int_{a}^{x}f(t)\,\mathrm{d}t\right)  =\frac{1}{h}\int_{x}^{x+h}f(t)\,\mathrm{d}t = \frac{1}{h}f(c)(x+h-x) = f(c). As h\to0 we see that c\to x and from the continuity of f it follows that f(c)\to f(x). Thus F'(x)=f(x).

\square

Antiderivative

If F'(x)=f(x) on some open interval then F is the antiderivative (or the primitive function) of f. The fundamental theorem of calculus guarantees that for every continuous function f there exists an antiderivative  F(x) = \int_{a}^{x}f(t)\,dt. The antiderivative is not necessarily expressible as a combination of elementary functions even if f were an elementary function, e.g. f(x) = e^{-x^{2}}. Such primitives are called nonelementary antiderivatives.

Theorem.

Antiderivatives are only unique up to a constant; \int f(x)\,dx = F(x) + C, C\in\mathbb{R} \text{ constant } if F'(x)=f(x).

Proof.

Suppose that F'_{1}(x)=F'_{2}(x)=f(x) for all x. Then the derivative of F_{1}(x)-F_{2}(x) is identically zero and thus the difference is a constant.

\square

(Second) Fundamental theorem of calculus

Let f\colon\left[a,b\right]\to\mathbb{R} be a continuous function and G an antiderivative of f, then \int_{a}^{b}f(x)\,dx = G(x)\Big|_{x=a}^{x=b} = G(b)-G(a).

Proof.

Because F(x)=\int_{a}^{x}f(t)\,dt is an antiderivative of f then due to continuity F(x)-G(x)=C=\text{constant} for all x\in\left[a,b\right]. Substituting x=a we find that C=-G(x). Thus \int_{a}^{x}f(t)\,dt = F(x) = G(x)-G(a) and substituting x=b the result follows.

\square


Suppose that f is a continuous function and that a and b are differentiable functions. Then \frac{d}{dx}\int_{a(x)}^{b(x)}f(t)\,dt = f(b(x))b'(x)-f(a(x))a'(x).

Proof.

Suppose that F is an antiderivative of f. Then from the fundamental theorem of calculus and the chain rule it follows that \frac{d}{dx}\int_{a(x)}^{b(x)}f(t)\,dt  = \frac{d}{dx}\big(F(b(x)) - F(a(x))\big) =\frac{d}{dx}F(b(x)) - \frac{d}{dx}F(a(x)) = F'(b(x))b'(x) - F'(a(x))a'(x)  = f(b(x))b'(x) - f(a(x))a'(x).

\square

Integrals of elementary functions


Constant Functions

Given the constant function f(x) = c,\,c\in\mathbb{R}. The integral \int\limits_a^b f(x)\,\mathrm{d} x = \int\limits_a^b c \, \mathrm{d}x has to be determined now.

Solution by finding a antiderivative

From the previous chapter it is known that g(x) = c\cdot x gives g'(x) = c. This means that c \cdot x is an antiderivative for c. So the following applies \int\limits_a^b c \, \mathrm{d}x = [c \cdot x]_{x=a}^{x=b} = c\cdot b - c \cdot a = c \cdot (b-a).

Remark: Of course, a function h(x) = c \cdot x + d would also be an antiderivative of f, since the constant d is omitted in the derivation. For sake of simplicity c \cdot x can be used, since d can be chosen as d=0 for definite integrals.

Solution by geometry

The area under the constant function forms a rectangle with height c and length b-a. Thus the area is c \cdot (b-a) and this corresponds to the solution of the integral. Illustrate this remark by a sketch.

Linear functions

Given is the linear function  f(x) = mx. We are looking for the integral \int\limits_a^b f(x)\, \mathrm dx=\int\limits_a^b mx\, \mathrm dx.

Solve by finding a antiderivative

The antiderivative of a linear function is in any case a quadratic function, since \frac{\mathrm d x^2}{\mathrm dx} = 2x . The derivative of a quadratic function results in a linear function. Here, it is important to consider the leading factor as in \frac{\mathrm d (m \cdot \frac{1}{2} \cdot x^2)}{\mathrm dx} = mx. Thus the result is \int\limits_a^b mx \mathrm{d}x = \left[\frac{m}{2}x^2 \right]_{x=a}^{x=b}= \frac{m}{2}b^2 - \frac{m}{2}a^2.

Solving by geometry

The integral \int\limits_a^b mx\, \mathrm dx can be seen geometrically, as subtracting the triangle with the edges (0|0), (a|0) and (a| ma) from the triangle with the edges (0|0), (b|0) and (b| mb). Since the area of a triangle ist given by \frac{1}{2} \cdot \mbox{baseline} \cdot \mbox{height}, the area of the first triangle \frac{1}{2}\cdot b \cdot mb = \frac{1}{2}mb^2 and that of the second triangle is analogous \frac{1}{2}ma^2. For the integral the result is \frac{m}{2}b^2 - \frac{m}{2}a^2. This is consistent with the integral calculated using the antiderivative. Illustrate this remark by a sketch.

Power functions

In constant and linear functions we have already seen that the exponent of a function decreases by one when it is derived. So it has to get bigger when integrating. The following applies: \frac{\mathrm d x^n}{\mathrm dx} = n \cdot x^{n-1}. It follows that the antiderivative for x^n must have the exponent n+1, \frac{\mathrm d x^{n+1}}{\mathrm dx} = (n+1) \cdot x^n. By multiplying the last equation with \frac{1}{n+1} we get \frac{\mathrm d}{\mathrm dx}\frac{1}{n+1} x^{n+1} = \frac{n+1}{n+1} \cdot x^n = x^n. Finally the antiderivative is \int x^n\, \mathrm dx = \frac{1}{n+1} x ^{n+1}+c,\,c\in\mathbb{R}.

Examples

  • \int x^2\, \mathrm dx = \frac{1}{3} x^3 +c,\,c\in\mathbb{R}
  • \int x^3\, \mathrm dx = \frac{1}{4} x^4 +c,\,c\in\mathbb{R}
  • \int x^{20}\, \mathrm dx = \frac{1}{21} x^{21} +c,\,c\in\mathbb{R}

The formula \int x^n\, \mathrm dx = [\frac{1}{n+1} x^{n+1}] is also valid, if the exponent of the function is a real number and not equal -1.

Examples

  • \int x^{2,7}\, \mathrm dx = \frac{1}{3,7} x^{3,7}+c,\,c\in\mathbb{R}
  • \int \sqrt{x}\, \mathrm dx = \int x^\frac{1}{2} = \frac{2}{3} x^{\frac{3}{2}}+c,\,c\in\mathbb{R}
  • But: For x\gt0 applies\int x^{-1}\,\mathrm d x=\ln(x)+c,\,c\in\mathbb{R}.

Natural Exponential function

The natural exponential function f(x) = e^x is one of the easiest function to differentiate and integrate. Since the derivation of e^x results in e^x, it follows \int e^x\, \mathrm dx = e^x +c, \, c\in \mathbb{R}.

Example 1

Determine the value of the integral \int_0^1 e^z \,\mathrm{d} z.

\int\limits_0^1e^z\,\mathrm{d}z= e^z\big|_{z=0}^{z=1}=e^1-e^0=e-1.

Example 2

Determine the value of the integral \int_0^b e^{\alpha t} \,\mathrm{d} t. Using the same considerations as above we get \int\limits_0^b e^{\alpha t}\,\mathrm{d}t= \frac{1}{\alpha}e^{\alpha t}\big|_{t=0}^{t=b} =\frac{1}{\alpha}\left(e^{\alpha b}-e^0\right)=\frac{1}{\alpha}\left(e^{\alpha b}-1\right). Important is here, that we have to use the factor \frac1{\alpha}.

Natural Logarithm

The derivative of the natural logarithmic function is \ln'(x) =\frac{1}{x} for x\gt0. It even applies \ln'(x) =\frac{1}{x} to x. These results together result in for the antiderivative of \frac{1}{x}

\int \frac{1}{x}\,\mathrm{d}x = \ln\left(|x|\right) +c , c\in\mathbb{R}.

An antiderivative can be specified for the natural logarithm: \int \ln(x)\,\mathrm{d}x = x\ln(x) - x + c ,\, c\in\mathbb{R}.

Trigonometric function

The antiderivatives of \sin(x) and \cos(x) also result logically if you derive "backwards". We have \int \sin(x)\, \mathrm dx = -\cos(x)+c,\,c\in\mathbb{R}, since  (-\cos(x))' =-(-\sin(x))=\sin(x). Furthermore we know \int \cos(x)\, \mathrm dx = \sin(x)+c,\,c\in\mathbb{R}, since (\sin(x))' = \cos(x) applies.

Example 1

Which area is covered by the sine on the interval [0,\pi] and the x-axis? To determination the area we simply have to evaluate the integral \int_0^{\pi} \sin(\tau) \, \mathrm{\tau}. That means \int_0^{\pi} \sin(\tau) \, \mathrm{d}\tau = \left[-\cos(\tau)\right]_{\tau=0}^{\tau=\pi} = 
	-\cos(\pi) - (-\cos(0)) = -(-1) - (-1) = 2. Again make a sketch for this example.

Example 2

How can the integral \int \cos(\omega t +\phi)\,\mathrm{d}t be expressed analytically?

To determine the integral we use the antiderivative of the cosine: \sin'(x) = \cos(x). However, the inner derivativ has to be considered in the given function and thus we get \int \ \cos(\omega t +\phi)\,\mathrm{d}t =\frac{1}{\omega}\sin(\omega t+\phi)+c,\,c\in\mathbb{R}.

Summary:

The most common antiderivatives follow from the rules of differentiation: \int x^{r}\,dx = \frac{1}{r+1}x^{r+1} + C, ~r\neq-1 \int x^{-1}\,dx = \ln|x| + C \int e^{x}\,dx = e^{x} + C \int \sin x\,dx = -\cos x + C \int \cos x\,dx = \sin x + C \int \frac{dx}{1+x^{2}} = \arctan x + C

Example 1

Evaluate the integrals \displaystyle \int_{-1}^{1}e^{-x}\,dx and \displaystyle\int_{0}^{1}\sin(\pi x)\,dx.

Solution. The antiderivative of e^{-x} is -e^{-x} so we have that \int_{-1}^{1}e^{-x}\,dx = -e^{-1}+e^{1} = 2\sinh1. The antiderivative of \sin(\pi x) is -\frac{1}{\pi}\cos(\pi x) and thus \int_{0}^{1}\sin(\pi x)\,dx = -\frac{1}{\pi}(\cos\pi-\cos0) = \frac{2}{\pi}.

Example 2

Evaluate the integral \displaystyle\int_{0}^{1}\frac{x}{\sqrt{25-9x^{2}}}\,dx.

Solution. The antiderivative might look something like F(x)=a(25-9x^{2})^{1/2}, where we can find the factor a through differentiation: D\big(a(25-9^{2})^{1/2}\big) = a\cdot\frac{1}{2}\cdot(-18x)(25-9x^{2})^{-1/2} = \frac{-9ax}{\sqrt{25-9x^{2}}} hence if a=-1/9 we get the correct antiderivative. Thus \int_{0}^{1}\frac{x}{\sqrt{25-9x^{2}}}\,dx = -\frac{1}{9}\cdot(25-9x^{2})^{1/2}\Big|_{x=0}^{x=1} = -\frac{1}{9}(\sqrt{16}-\sqrt{25}) = \frac{1}{9}. This integral can also be solved using integration by substitution; more on this method later.

Geometric applications


Area of a plane region

Suppose that f and g are piecewise continuous functions. The area of a region bounded by the graphs y=f(x), y=g(x) and the vertical lines x=a and x=b is given by the integral A=\int_{a}^{b}|f(x)-g(x)|\,dx.

Especially if f is a non-negative function on the interval [a,b] and g(x)=0 for all x then the integral A=\int_{a}^{b}f(x)\,dx is the area of the region bounded by the graph y=f(x), the x-axis and the vertical lines x=a and x=b.

Arc length

The arc length \ell of a planar curve y=f(x) between points x=a and x=b is given by the integral \ell = \int_{a}^{b}\sqrt{1+f'(x)^{2}}\,dx.

Heuristic reasoning: On a small interval \left[x,x+\Delta x\right] the arc length of the curve between y=f(x) and y=f(x+\Delta x) is approximately \Delta s \approx \sqrt{\Delta x^{2} + \Delta y^{2}} = \Delta x\sqrt{1+\left(\frac{\Delta y}{\Delta x}\right)^{2}} \approx \Delta x\sqrt{1+f'(x)^{2}}.

Interactive. Arc length approximation using secant vectors. The length of each vector is \Delta s.

Surface of revolution

The area of a surface generated by rotating the graph y=f(x) around the x-axis on the interval \left[a,b\right] is given by A = 2\pi\int_{a}^{b}|f(x)|\sqrt{1+f'(x)^{2}}\,dx. Heuristic reasoning: An area element of the surface is approximately \Delta A \approx \text{perimeter}\cdot\text{length} = 2\pi|f(x)|\cdot\Delta s.

Solid of revolution

Suppose that the cross-sectional area of a solid is given by the function A(x) when x\in\left[a,b\right]. Then the volume of the solid is given by the integral V = \int_{a}^{b}A(x)\,dx. If the graph y=f(x) is rotated around the x-axis between the lines x=a and x=b the volume of the generated figure (the solid of revolution) is V = \pi\int_{a}^{b}f(x)^{2}\,dx. This follows from the fact that the cross-sectional area of the figure at x is a circle with radius f(x) i.e. A(x)=\pi f(x)^{2}.

More generally: Let 0\le g(x)\le f(x) and suppose that the region bounded by y=f(x) and y=g(x) and the lines x=a and x=b is rotated around the x-axis. The volume of this solid of revolution is V = \pi\int_{a}^{b}\big(f(x)^{2}-g(x)^{2}\big)\,dx.

Improper integral


Definition: Improper integral
  • 1st kind: The integral is defined on an unbounded domain, \left[a,\infty\right[,\left]-\infty,b\right] or the entire \mathbb{R}.
  • 2nd kind: The integrand function is unbounded in the domain of integration or a two-sided limit doesn't exist on one or both of the endpoints of the integral

One limitation of the improper integration is that the limit must be taken with respect to one endpoint at a time.

Example

\int_{0}^{\infty}\frac{dx}{\sqrt{x}(1+x)} = \int_{0}^{1}\frac{dx}{\sqrt{x}(1+x)} + \int_{1}^{\infty}\frac{dx}{\sqrt{x}(1+x)} Provided that both of the integrals on the right-hand side converge. If either of the two is divergent then so is the integral.

Definition

Let f\colon\left[a,\infty\right[\to\mathbb{R} be a piecewise continuous function. Then \int_{a}^{\infty}f(x)\,dx = \lim_{R\to\infty}\int_{a}^{R}f(x)\,dx provided that the limit exists and is finite. We say that the improper integral of f converges over \left[a,\infty\right[.

Likewise for f\colon\left]-\infty,b\right]\to\mathbb{R} we define \int_{-\infty}^{b}f(x)\,dx = \lim_{R\to\infty}\int_{-R}^{b}f(x)\,dx provided that the limit exists and is finite.


Example

Find the value of \displaystyle\int_{0}^{\infty}e^{-x}\,dx.

Solution. Notice that \int_{0}^{R}e^{-x}\,dx = \left(-e^{-x}\right)\Bigg|_{x=0}^{R}=1-e^{-R}\to 1 as R\to\infty. Thus the improper integral converges and \int_{0}^{\infty}e^{-x}\,dx = 1.

Definition

Let f\colon\mathbb{R}\to\mathbb{R} be a piecewise continuous function. Then \int_{-\infty}^{\infty}f(x)\,dx = \int_{-\infty}^{0}f(x)\,dx + \int_{0}^{\infty}f(x)\,dx if both of the two integrals on the right-hand side converge.

In the case f(x)\ge0 for all x\in\mathbb{R} the following holds \int_{-\infty}^{\infty}f(x)\,dx = \lim_{R\to\infty}\int_{-R}^{R}f(x)\,dx.


However, this doesn't apply in general. For example, let f(x)=x. Note that even though 
	\int_{-R}^{R}f(x)\,dx = \int_{-R}^{R}x\,dx = \frac{R^2}{2} - \frac{(-R)^2}{2} = 0
	for all R\in\mathbb{R} the improper integral 
	\int_{-\infty}^{\infty}x\,dx = \lim_{R\to\infty}\int_{-R}^{0}x\,dx + \lim_{R\to\infty}\int_{0}^{R}x\,dx = \lim_{R\to\infty}-\frac{(-R)^2}{2} + \lim_{R\to\infty}\frac{R^2}{2} = \infty - \infty
	does not converge.

Improper integrals of the 2nd kind are handled in a similar way using limits. As there are many different (but essentially rather similar) cases, we leave the matter to one example only.

Example

Find the value of the improper integral \displaystyle\int_{0}^{1}\frac{dx}{\sqrt{x}}.

Solution. We get \int_{\epsilon}^{1}\frac{dx}{\sqrt{x}} = \left(2\sqrt{x}\right)\Bigg|_{x=\epsilon}^{x=1} = 2-2\sqrt{\epsilon} \to 2, as \epsilon\to0+. Thus the integral converges and its value is 2.

The improper integral of f(x)=1/\sqrt{x} from x=0 to x=1.

Comparison test


One way of studying the convergence of an improper integral is using the comparison test.
Theorem.
Suppose that f and g are integrable functions such that |f(x)|\le g(x) for a < x < b.
  1. If the improper integral I=\int_{a}^{b}g(x)\,dx converges then so does \displaystyle\int_{a}^{b}f(x)\,dx and its value is less than or equal to I.
  2. If the improper integral \int_{a}^{b}f(x)\,dx diverges then so does \displaystyle\int_{a}^{b}g(x)\,dx.
Example 2

Notice that 0\le\frac{1}{\sqrt{x}(1+x)}\le\frac{1}{\sqrt{x}}, \text{ for }0 < x < 1 and that the integral \int_{0}^{1}\frac{dx}{\sqrt{x}} = 2 converges. Thus by the comparison test the integral \int_{0}^{1}\frac{dx}{\sqrt{x}(1+x)} also converges and its value is less than or equal to 2.

Example 3

Likewise 0\le\frac{1}{\sqrt{x}(1+x)} < \frac{1}{\sqrt{x}(0+x)}=\frac{1}{x^{3/2}}, \text{ for }x\ge1 and because \displaystyle\int_{1}^{\infty}x^{3/2}\,dx=2 converges so does \int_{1}^{\infty}\frac{dx}{\sqrt{x}(1+x)} and its value is less than or equal to 2.

Note. The choice of the dominating function depends on both the original function and the interval of integration.

Example 4

Determine whether the integral \int_{0}^{\infty}\frac{x^2+1}{x^3(\cos^2{x}+1)}\,dx converges or diverges.

Solution. Notice that x^2+1\ge x^2 for all x\in\mathbb{R} and therefore \frac{x^2+1}{x^3(\cos^2{x}+1)} \ge \frac{1}{x\underbrace{(\cos^2{x}+1)}_{\le 2}} \ge \frac{1}{2x}. Now, because the integral \displaystyle\int_{0}^{\infty}\frac{dx}{2x} diverges then by the comparison test so does the original integral.

Integration techniques


Logarithmic integration

Given a quotient of differentiable functions, we know to apply the quotient rule. However, this is not so easy with integration. Here only for a few special cases we will state rules in this chapter.

Logarithmic integration As we already know the derivative of \ln(x), i.e. the natural logarithm to the base e, equal to \frac{1}{x}. According to the chain rule the derivative of differentiable function with positive function values is f\,:\,\frac{\mathrm d}{\mathrm dx} \ln (f(x)) = \frac{f'(x)}{f(x)}. This means that for a quotient of functions where the numerator is the derivative of the denominator yields the rule: \begin{equation} \int \frac{f'(x)}{f(x)}\, \mathrm{d} x= \ln \left(|f(x)|\right) +c,\,c\in\mathbb{R}.\end{equation} Using the absolute value of the function is important, since the logarithm is defined on \mathbb{R}^+.

Examples
  • \int \frac{1}{x}\, \mathrm dx = \int \frac{x'}{x} \mathrm\, dx = \ln(|x|) +c,\,c\in\mathbb{R} .

  • \int \frac{3x^2 + 17}{x^3 +17x - 15}\, \mathrm dx = \ln(|x^3 + 17x - 15|)+c,\,c\in\mathbb{R}.

  • \int \frac{\cos(x)}{\sin(x)}\,\mathrm dx = \ln(|\sin(x)|)+c,\,c\in\mathbb{R}.

Integration of rational functions - partial fraction decomposition

The logarithmic integration works well in special cases of broken rational functions where the counter is a multiple of the derivation of the denominator. However, other cases can sometimes be traced back to this. This method is called partial fractional decomposition, which represents rational functions as the sum of proper rational functions.

Example 1

The function \frac{1}{1-x^2} cannot be integrated at first glance. However, the denominator 1-x^2 can be written as (1-x)(1+x) and the function can finally reads as \dfrac{1}{1-x^2} = \dfrac{\frac{1}{2}}{1+x} + \dfrac{\frac{1}{2}}{1-x} by partial fraction decomposition. This expression can be integrated, as demonstrated now: \begin{eqnarray} \int \dfrac{1}{1-x^2} \,\mathrm dx &= & \int \dfrac{\frac{1}{2}}{1+x} + \dfrac{\frac{1}{2}}{1-x}\, \mathrm dx \\ & =& \frac{1}{2} \int \dfrac{1}{1+x}\, \mathrm dx - \frac{1}{2} \int \dfrac{-1}{1-x}\, \mathrm dx\\ & = &\frac{1}{2} \ln|1+x| +c_1 - \frac{1}{2} \ln|1-x| +c_2\\ &= &\frac{1}{2} \ln \left|\dfrac{1+x}{1-x}\right|+c,\,c\in\mathbb{R}. \end{eqnarray} This procedure is now described in more detail for some special cases.

Case 1: Q(x)=(x-\lambda_1)(x-\lambda_2) with \lambda_1\ne\lambda_2. In this case, R has the representation R(x) = \frac{ax+b}{(x-\lambda_1)(x-\lambda_2)} and can be transformed to \frac{ax+b}{(x-\lambda_1)(x-\lambda_2)} = \frac{A}{(x-\lambda_1)}+\frac{B}{(x-\lambda_2)}. By multiplying with (x-\lambda_1)(x-\lambda_2) it yields ot ax+b = A(x-\lambda_1) + B(x-\lambda_2) = \underbrace{(A+B)}_{\stackrel{!}{=}a}x + \underbrace{(-A\lambda_1-B\lambda_2)}_{\stackrel{!}{=}b}.

A and B are now obtained by the method of equating the coefficients.

Example 2

Determe the partial fraction decomposition of \frac{2x+3}{(x-4)(x+5)}.

Start with the equation \frac{2x+3}{(x-4)(x+5)} = \frac{A}{(x-4)}+\frac{B}{(x+5)} to get the parameters A and B. Multiplication by {(x-4)(x+5)} leads to 2x+3 = A(x+5)+B(x-4) = (A+B)x +5A -4B. Now we get the system of linear equations

\begin{eqnarray}A+B & = & 2 \\ 5A - 4 B &=& 3\end{eqnarray} with the solution A = \frac{11}{9} and B= \frac{7}{9}. The representation with proper rational functions is \frac{2x+3}{(x-4)(x+5)}=\frac{11}{9}\frac{1}{(x-4)}+\frac{7}{9}\frac{1}{(x+5)} The integral of the type \int \frac{ax+b}{(x-\lambda_1)(x-\lambda_2)}\,\mathrm{d} x. is no longer mystic.

With the help of partial fraction decomposition, this integral can now be calculated in the following manner \begin{eqnarray}\int \frac{ax+b}{(x-\lambda_1)(x-\lambda_2)}\mathrm{d} x &=& \int\frac{A}{(x-\lambda_1)}+\frac{B}{(x-\lambda_2)}\mathrm{d} x \\ &=&A\int\frac{1}{(x-\lambda_1)}\mathrm{d} x +B\int\frac{1}{(x-\lambda_2)}\mathrm{d} x \\ & = & A\ln(|x-\lambda_1|) + B\ln(|x-\lambda_2|).\end{eqnarray}

Example 3

Determine the antiderivative for \frac{2x+3}{(x-4)(x+5)}, i.e. \int\frac{2x+3}{(x-4)(x+5)}\,\mathrm{d} x.

From the above example we already know: \int\frac{2x+3}{(x-4)(x+5)}\,\mathrm{d} x = \int\frac{11}{9}\frac{1}{(x-4)}+\frac{7}{9}\frac{1}{(x+5)}\, \mathrm{d} x.

Using the idea explained above immediately follow: \int\frac{11}{9}\frac{1}{(x-4)}+\frac{7}{9}\frac{1}{(x+5)} \,\mathrm{d} x = \frac{11}{9}\int\frac{1}{(x-4)} \mathrm{d} x + \frac{7}{9}\int\frac{1}{(x+5)} \,\mathrm{d} x= \frac{11}{9}\ln(|(x-4)|)+\frac{7}{9}\ln(|(x+5)|). So is the result \int\frac{2x+3}{(x-4)(x+5)}\,\mathrm{d} x=\frac{11}{9}\ln(|(x-4)|)+\frac{7}{9}\ln(|(x+5)|).

Case 2: Q(x)=(x-\lambda)^2.

In this case R has the representation R(x) = \frac{ax+b}{(x-\lambda)^2} and the ansatz \frac{ax+b}{(x-\lambda)^2} = \frac{A}{(x-\lambda)}+\frac{B}{(x-\lambda)^2} is used.

By multiplying the equation with (x-\lambda)^2 we get ax+b = A(x-\lambda) + B. Again equating the coefficients leads us to a system of linear equations in A=a and B=b+A\lambda=b+a\lambda.

So we have \int \frac{ax+b}{(x-\lambda)^2}\,\mathrm{d}x = \int \frac{a}{(x-\lambda)}+\frac{b+a\lambda}{(x-\lambda)^2} \mathrm{d}x =a\ln(|x-\lambda|)-\frac{b+a\lambda}{(x-\lambda)}+c,\,c\in\mathbb{R}.

3. case Q(x)=x^2+mx+n without real zeros.

In this case R has the representation R(x) = \frac{ax+b}{x^2+mx+n} and the representation can not be simplified.

Only the special case R(x) = \frac{2x+m}{x^2+mx+n} is now considered.

In this case we have \int \frac{2x+m}{x^2+mx+n}\,\mathrm{d}x = \ln(|x^2+mx+n|)+c, \quad c\in\mathbb{R}.

Another special case is R(x) = \frac{1}{x^2+1} with \int \frac{1}{x^2+1} \, \mathrm{d} x = \arctan(x) +c,\quad c\in \mathbb{R}.

Integration by Parts

The derivative of a product of two continuously differentiable functions f and g is (f(x)\cdot g(x))' = f'(x)\cdot g(x)+f(x)\cdot g'(x),\quad x\in(a,b).

This leads us to the following theorem:

Theorem: Integration by Parts

Letf and g be continuously differentiable functions on the interval \left[a,b\right]. Then \int_{a}^{b}f'(x)g(x)\,dx = f(b)g(b)-f(a)g(a)-\int_{a}^{b}f(x)g'(x)\,dx Likewise for the indefinite integral it holds that \int f'(x)g(x)\,dx = f(x)g(x)-\int f(x)g'(x)\,dx.

Proof

It follows from the product rule that \frac{d}{dx}(f(x)g(x)) = f'(x)g(x) + f(x)g'(x) or rearranging the terms f'(x)g(x) = \frac{d}{dx}(f(x)g(x)) - f(x)g'(x). Integrating both sides of the equation with respect to x and ignoring the constant of integration now yields \int f'(x)g(x) = f(x)g(x) - \int f(x)g'(x)\,dx.

Example

Solve the integral \displaystyle\int_{0}^{\pi}x\sin x\,dx.

Solution. Set f'(x)=\sin x and g(x) = x. Then f(x)=-\cos x and g'(x) = 1 and the integration by parts gives \int_{0}^{\pi}x\sin x\,dx = -\pi\cos\pi - 0 - \int_{0}^{\pi}(-\cos x)\,dx =\pi+\left(\sin x\right)\Bigg|_{x=0}^{\pi} = \pi.

Notice that had we chosen f and g the other way around this would have led to an even more complicated integral.

Integration by Substitution

Theorem: Integration by substitution

Let f and g be continuously differentiable functions on \left[a,b\right]. Then \int_{a}^{b}f(g(x))g'(x)\,dx = \int_{g(a)}^{g(b)}f(u)\,du.

Proof.

Let F'(x)=f(x). Then \int_{a}^{b}f(g(x))g'(x)\,dx = \int_{a}^{b}(F\circ g)'(x)\,dx = (F\circ g)(b) - (F\circ g)(a) = F(g(b)) - F(g(a)) = \int_{g(a)}^{g(b)}f(u)\,du.

In practise: Substituting u=g(x) we have (heuristically) \frac{du}{dx}=g'(x)\Rightarrow du=g'(x)\,dx and the limits of integration x=a\Rightarrow u=g(a),x=b\Rightarrow u=g(b).


Example 1

Find the value of the integral \displaystyle\int_{0}^{\pi^2}\sin\sqrt{x}\,dx.

Solution. Making the substitution x=t^{2} when t\ge0 we have dx=2t\,dt. Solving the limits from the inverse formula i.e. t=\sqrt{x} we find that t(0)=0 and t(\pi^{2})=\pi. Hence \int_{0}^{\pi^{2}}\sin\sqrt{x}\,dx = \int_{0}^{\pi^{2}}2t\sin t\,dt = 2\int_{0}^{\pi}t\sin t\,dt = 2\pi.

Here the latter integral was solved applying integration by parts in the previous example.

Example 2

Find the antiderivative of \displaystyle\frac{1}{\sqrt{x}(1+x)}.

Solution. Substituting x=t^{2}, t>0 or t=\sqrt{x} gives \int\frac{dx}{\sqrt{x}(1+x)} = \int\frac{2t}{t(1+t^{2})}\,dt = 2\arctan t + C = 2\arctan\sqrt{x} + C.

'; }],{ useMathJax : true, fontSize : 14, fixed : true })); txts.push(b2.create('text',[2,-5, function() { return 'L(f)=' + rsums[1].Value().toFixed(3) + ''; } ],{ useMathJax : true, fontSize : 14, fixed : true })); b1.fullUpdate(); b2.fullUpdate(); }; plotButton.click(); })(); ', label : { useMathJax : true, offset : [0, 30] } }); board.create('integral', [[0.2, 1.4], graph], { fillColor : 'blue', curveRight : { visible : false }, curveLeft : { visible : false }, withLabel : false, baseLeft : { visible : true, showinfobox : false, size : 1, strokeColor : 'black', withLabel : true, name : 'a', label : { useMathJax : true, offset : [0, -1] }}, baseRight : { visible : true, showinfobox : false, size : 1, strokeColor : 'black', withLabel : true, name : 'b', label : { useMathJax : true, offset : [0, -1] }} } ); board.fullUpdate(); })();

9. Differentiaaliyhtälöt

Johdanto


Differentiaaliyhtälö on yhtälö, joka sisältää tuntemattoman funktion, esimerkiksi   y = y(x)  , ja sen derivaattoja  y'(x), y''(x), \ldots, y^{(n)}(x) . Tässä tuntematon funktio on yhden muuttujan funktio, jolloin puhutaan tavallisista differentiaaliyhtälöistä (ordinary differential equation ODE) tai lyhyesti vain differentiaaliyhtälöistä (DY). Jos tuntematon funktio riippuu useammista muuttujista, niin kyseessä on osittaisdifferentiaaliyhtälö (partial differential equation PDE), mutta niitä ei käsitellä tällä kurssilla.

Radioaktiivinen hajoaminen on tyyppillinen ilmiö, joka johtaa differentiaaliyhtälöön. Jos  y=y(t) on radiaktiivisten ydinten lukumäärä ajan hetkellä  t , niin lyhyellä aikavälillä  \Delta t ydinten lukumäärän muutos on suunnilleen  \Delta y \approx -k y(t)\cdot \Delta t, jossa  k on aineesta riippuva positiivinen vakio (hajoamisvakio). Approksimaatio paranee, kun  \Delta t \to 0, joten  y'(t) \approx \Delta y/\Delta t \approx -ky(t) . Näin ollen differentiaaliyhtälö  y'(t)=-ky(t) on radioaktiivisen hajoamisen matemaattinen malli. Todellisuudessa ydinten lukumäärä  y(t) on kokonaisluku, joka pienenee hyppäyksittäin, eikä se voi olla derivoituva (tai oikeastaan derivaatta on enimmäkseen pelkkää nollaa!). Näin ollen malli kuvaa jonkin idealisoidun version  y(t) käyttäytymistä. Tämä ilmiö toistuu useissa matemaattisissa malleissa.

Kertaluku

Differentiaaliyhtälön kertaluku on yhtälössä esiintyvän korkeimman derivaatan kertaluku.

Esimerkiksi differentiaaliyhtälön  y' + 3y = \sin(x) kertaluku on 1, ja differentiaaliyhtälön  y'' + 5y' -6y = e^x kertaluku on 2.

Tässä ja yleensä funktion y muuttuja ei ole näkyvissä; usein ajatellaan, että DY määrää funktion y implisiittisesti.

Differentiaaliyhtälön ratkaisu

Kertalukua n oleva DY on yleisesti muotoa

 \begin{equation} \label{dydef}
F(x, y(x), y'(x),\ldots , y^{(n)}(x)) = 0
\end{equation}

DY:n ratkaisu on sellainen n kertaa derivoituva funktio y(x), joka toteuttaa yhtälön kaikilla  x \in I, , kun I on jokin reaaliakselin avoin väli.

Ratkaisut eivät yleensä ole yksikäsitteisiä, vaan niitä on äärettömän monta. Tarkastellaan esimerkiksi differentiaaliyhtälöä  xy^2 + y' = 0. Tämän DY:n ratkaisuja ovat mm.

  •  y_0(x) = 0,\enspace x \in \mathbb{R}
  •  y_1(x) = 2/x^2,\enspace x>0
  •  y_2(x) = 2/x^2,\enspace x
  •  y_3(x) = 2/(x^2 + 3),\enspace x \in \mathbb{R}

Tässä  y_1,  y_2 ja  y_3 ovat yksittäisratkaisuja. DY:n yleinen ratkaisu on muotoa  y(x) = 2/(x^2 + C),\> C \in \mathbb{R}. Yleisestä ratkaisusta saadaan yksittäisratkaisuja kiinnittämällä parametrille C jokin arvo. Ratkaisuja, joita ei saada tällä tavalla yleisestä ratkaisuta, kutsutaan DY:n erikoisratkaisuiksi.

Kaikilla differentiaaliyhtälöillä ei ole lainkaan ratkaisuja. Esimerkiksi 1. kertaluvun DY:llä  \sin(y' + y) = 2 ei ole lainkaan ratkaisuja. Jos 1. kertaluvun DY voidaan kirjoittaa normaalimuodossa  y' = f(x,y) , jossa f on jatkuva kahden muuttujan funktio, niin ratkaisuja on olemassa.

Alkuehdot

Yleisessä ratkaisussa esiintyvät vakiot kiinnittyvät yleensä, jos ratkaisulta vaaditaan joitakin lisäehtoja. Voimme esimerkiksi vaatia, että ratkaisu saa arvon  y_0 kohdassa  x_0 asettamalla alkuehto  y(x_0) = y_0. Ensimmäisen kertaluvun differentiaaliyhtälöiden kohdalla yksi alkuehto riittää (yleensä) takaamaan ratkaisun yksikäsitteisyyden. Toisen kertaluvun DY:iden kohdalla tarvitaan kaksi ehtoa, jos halutaan saada yksikäsitteinen ratkaisu. Tällöin alkuehdot tulevat muotoon

 \left\{ \begin{array} y(x_0) = y_0 \\ y'(x_0) = y_1 \end{array} \right.

Huom: Reunaehtojen y(x_0) = y_0, y(x_1)=y_1 tapauksessa tilanne on hankalampi.

Yleisen kertalukua n olevan differentiaaliyhtälön tapauksessa tarvitaan n lisäehtoa, jotta ratkaisusta tulee yksikäsitteinen. Differentiaaliyhtälöä yhdessä alkuehtojen kanssa kutsutaan alkuarvotehtäväksi.

Esimerkki 1.

Aikaisemmin todettiin, että differentiaaliyhtälön  xy^2 + y' = 0 yleinen ratkaisu on muotoa  y(x) = 2/(x^2 + C). Näin ollen alkuarvotehtävän

 \left\{\begin{align} xy^2 + y' = 0 \\ y(0) = 1 \end{align} \right.

ratkaisu on  y(x) = 2/(x^2 + 2).

Kokeile! Yllä on esitetty joitakin ratkaisuja differentiaaliyyhtälölle 

 xy^2 + y' = 0. Tutki, miten alkuehdon muuttaminen vaikuttaa ratkaisuun (siirrä alkuehtopistettä hiirellä). Saatko eri ratkaisukäyrät (ratkaisujen kuvaajat) leikkaamaan toisiaan?

Suuntakenttä

Differentiaaliyhtälö  y' = f(x,y) voidaan tulkita myös geometrisesti: jos ratkaisukäyrä (eli ratkaisun kuvaaja) kulkee tason pisteen  (x_0, y_0) kautta, niin ratkaisulle pätee  y'(x_0) = f(x_0, y_0) , t.s. ratkaisukäyrän tangentin kulmakerroin voidaan määrittää ilman varsinaista ratkaisua y(x). Differentiaaliyhtälön suuntakenttä on vektoreiden  \vec{i} + f(x_k, y_k)\vec{j} muodostama kenttä, kun niitä piirretään sopiviin hilapisteisiin  (x_k, y_k). Suuntakentästä voidaan usein päätellä ratkaisujen kuvaajien muoto ainakin kvalitatiivisesti..

Kokeile! Yllä olevassa kuviossa on esitetty differentiaaliyhtälön  y' = \sin(xy) suuntakenttä. Tutki alkuehdon vaikutusta ratkaisuun. Kuten kuviosta ilmenee, alkuehto määrää ratkaisun myös negatiiviseen suuntaan.

Ensimmäisen kertaluvun differentiaaliyhtälö


Differentiaaliyhtälöiden teorian suurin vaikeus on siinä, ettei ole olemassa mitään yleispätevää ratkaisumenetelmää, joka toimii kaikissa tai edes yleisemmissä tapauksissa. Monille varsin yksinkertaisillekaan yhtälöille ei ole esimerkiksi mitään ratkaisukaavaa, ja tilanne vaikeutuu entisestään kertaluvun kasvaessa. Tämän vuoksi seuraavassa käsitellään muutamia sellaisia differentiaaliyhtälöitä, jotka voidaan ratkaista ("integroimalla"). Hankalammissa tapauksissa on joskus hyötyä pelkästään siitä, että tiedetään ratkaisun olemassaolo tai yksikäsitteisyys tietyillä alkuehdoilla.

Lineaarinen 1. kertaluvun DY

Muotoa

 p_n(x)y^{(n)} + p_{n-1}(x)y^{(n-1)} + \cdots + p_1(x)y' + p_0(x)y = r(x),

olevaa DY:ä kutsutaan lineaariseksi differentiaaliyhtälöksi. Vasemman puolen lauseke on lineaarikombinaatio tuntemattomasta funktiosta ja se derivativaatoista, joiden kertoimina ovat funktiot  p_k(x) . Ensimmäisen kertaluvun lineaarinen DY on siis muotoa

 p_1(x)y' + p_0(x)y = r(x). 

Jos  r(x) = 0 kaikilla x, niin yhtälö on homogeeninen. Muuten yhtälö on epähomogeeninen.

Lause 1.

Tarkastellan normaalimuotoista differentiaaliyhtälöä

 \left\{\begin{align}y^{(n)} + p_{n-1}(x)y^{(n-1)} + \cdots + p_1(x)y' + p_0(x)y = r(x) \\ y(x_0) = y_0, \: y'(x_0) = y_1, \: \ldots, \: y^{n-1}(x_0) = y_{n-1}. \end{align} \right.  

Jos funktiot  p_k ja  r ovat jatkuvia välillä  (a,b), joka sisältää alkuehtokohdan x_0, niin alkuarvotehtävällä on yksikäsitteinen ratkaisu.

Normaalimuoto on tärkeä vaatimus. Esimerkiksi DY:n x^2y'' - 4xy' + 6y = 0 ratkaisujen lukumäärä voi olla nolla tai ääretön alkuehdoista riippuen: Sijoittamalla yhtälöön  x=0 nähdään heti, että ehto  y(0)=0 on välttämätön ratkaisun olemassaololle. Yleisemmin korkeimman derivaatan kerroinfunktion nollakohdat hankaloittavat tilannetta, koska muuten tämä kerroin voidaan jakaa pois, ja yhtälö tulee normaalimuotoon.

1. kertaluvun DY:n ratkaiseminen

Lineaarinen 1. kertaluvun DY voidaan ratkaista ns. integroivan tekijän avulla. Menetelmän ideana idea on kertoa yhtälön  y' + p(x)y = r(x) molemmat puolet integroivalla tekijällä \displaystyle e^{\int p(x) dx} =e^{P(x)}, jolloin yhtälö tulee muotoon

 \displaystyle y'(x)e^{P(x)} + p(x)e^{P(x)}y(x) = r(x)e^{P(x)} \Leftrightarrow \frac{d}{dx}\left( y(x)e^{P(x)}\right) = r(x)e^{P(x)}.

Integroidaan tämän yhtälön molemmat puolet, jolloin saadaan

\displaystyle y(x)e^{P(x)} = \int r(x)e^{P(x)}\, \mathrm{d}x + C 
\Leftrightarrow y(x)= Ce^{-P(x)} + e^{-P(x)}\int r(x) e^{P(x)}\, \mathrm{d}x. 

Tätä kaavaa ei kannata opetella ulkoa, vaan mieluummin yrittää muistaa metelmän olennaiset välivaiheet, jotta niitä pystyy soveltamaan konkreettisiin tapauksiin.

Esimerkki 1.

Ratkaistaan DY \displaystyle y'-y = e^x+1. Integroiva tehijä on \displaystyle e^{\int (-1)\, \mathrm{d}x} = e^{-x}, joten kerrotaan yhtälö puolittain tällä lausekkeella:

\displaystyle e^{-x}y'-e^{-x}y = 1+e^{-x}

\displaystyle \frac{d}{dx}(y(x)e^{-x}) = 1+e^{-x}

\displaystyle y(x)e^{-x} = \int 1+e^{-x}\, \mathrm{d}x + C = x - e^{-x} + C

\displaystyle y(x)= e^xx - 1 + Ce^x.

Esimerkki 2.

Ratkaistaan alkuarvotehtävä

 \left\{\begin{align}xy' = x^2 + 3y \\ y(0) = 1 \end{align} \right.

Kirjoitetaan yhtälö ensin normaalimuodossa:

 \displaystyle y' - \frac{3}{x}y = x.

Integroiva tekijä on nyt \displaystyle e^{ \int \frac{3}{x} dx } =\displaystyle e^{ -3 \ln \vert x \vert } =\displaystyle e^{ \ln x^{-3} } =\displaystyle \frac{1}{x^3},\> x>0. Näin saadaan

\displaystyle \frac{y'}{x^3} - \frac{3}{x^4}y = \frac{1}{x^2}

\displaystyle \frac{d}{dx}(\frac{y}{x^3}) = \frac{1}{x^2}

\displaystyle \frac{y}{x^3} = \int \frac{1}{x^2}\, 
	\mathrm{d}x + C = - \frac{1}{x} + C

y (x)= Cx^3 - x^2.

Tämä on DY:n yleinen ratkaisu. Koska  y(0) = C\cdot 0 - 0 = 0, niin alkuehto ei voi toteutua koskaan, joten alkuarvotehtävällä ei ole ratkaisua. Syy tähän on se, että alkuehto on annettu johdassa  x_0=0, jossa DY:n normaalimuotoa ei ole määritelty. Mikä tahansa muu kohta  x_0 tuottaa yksikäsitteisen ratkaisun.

Esimerkki 3.

Ratkaistaan DY xy'-2y=2 alkuehdoilla

  1. y(1)=0
  2. y(0)=0.

Muodosta y'-(2/x)y=2/x nähdään, että kyseessä on lineaarinen DY. Integroiva tekijä on


e^{-\int (2/x)\, \mathrm{d}x} = e^{-2\ln |x|} = e^{\ln (1/x^2)} = \frac{1}{x^2}.
Tällä kertomalla saadaan

(1/x^2)y'(x)-(2/x^3)y(x) =\frac{2}{x^3} 
\Leftrightarrow 
\frac{d}{dx}\left( \frac{y(x)}{x^2}\right) = \frac{2}{x^3},

joten yleinen ratkaisu on y(x)=x^2 (-1/x^2+C)=Cx^2-1. Alkuehdosta y(1)=0 seuraa, että C=1, mutta ehto y(0)=0 johtaa ristiriitaan -1=0. Näin ollen a-kohdan ratkaisu on y(x)=x^2-1, mutta b-kohdassa ratkaisua ei ole; tässäkin sijoituksesta  x=0 differentiaaliyhtälöön seuraa, että  y(0)=-1.

Separoituva DY

Ensimmäisen kertaluvun DY on separoituva, jos se voidaan kirjoittaa muodossa  y' = f(x)g(y), , kun f ja g ovat jatkuvia funktioita. Tulkitsemalla  y'(x)=dy/dx epätäsmällisesti jakolaskuksi, kertomalla symbolilla  dx ja jakamalla lausekkeella  g(y) saadaan  \frac{dy}{g(y)}=f(x)\, dx. Integroidaan vasemmalla puolella muuttujan   y suhteen ja oikealla muuttujan  x suhteen saadaan

\displaystyle \int \frac{\mathrm{d}y}{g(y)} = \int f(x)\, \mathrm{d}x + C.

Tämä on ratkaisun implisiittinen muoto, josta voidaan usein ratkaista eksplisiittisesti y =y(x). Menetelmä voidaan perustella tarkemmin käyttämällä muuttujanvaihtoa integraalissa (eli ilman dx-dy-pyörittelyä).

Esimerkki 4.

Ratkaistaan DY \displaystyle y'+\frac{2}{5}x = 0 separointimenetelmällä. (Tämän DY:n voi poikkeuksellisesti ratkaista myös lineaarisena!)

 \displaystyle y'+\frac{2}{5}y = 0

 \displaystyle \frac{dy}{dx} = -\frac{2}{5}y   

 \displaystyle \int \frac{1}{y}\, \mathrm{d}y = -\frac{2}{5} \int \, \mathrm{d}x   

\displaystyle \ln |y| = -\frac{2}{5}x + C_1

 \displaystyle y =\pm e^{-\frac{2}{5}x+C_1} = \pm e^{-\frac{2}{5}x}e^{C_1} = Ce^{-\frac{2}{5}x}, \: C\neq 0.

Viimeisessä vaiheessa merkittiin C =\pm e^{C_1} yksinkertaisuuden vuoksi. Tapaus  C=0 on myös sallittu, sillä se johtaa triviaaliratkaisuun y(x)\equiv 0, vrt. alla.

Esimerkki 5.

Ratkaistaan alkuarvotehtävä

 \left\{\begin{align}y' = \frac{x}{y} \\ y(0) = 1 \end{align} \right.

Koska yleistä ratkaisua ei kysytä, voidaan oikaista käyttämällä määrättyä integraalia seuraavalla tavalla:

\displaystyle \frac{dy}{dx} = \frac{x}{y}

\displaystyle \int_1^y s \, \mathrm{d}s =\int_0^x t \, \mathrm{d}t

\displaystyle \frac{1}{2}y^2 - \frac{1}{2} =\frac{1}{2}x^2.

 Ratkaisu on siis  y=y(x)=\sqrt{x^2+1}.

Separoituvan DY:n eikoisratkaisut

Separointimenetelmällä saadusta yleisestä ratkaisusta puuttuu useinfunktion g(y) nollakohtiin liittyviä erikoisratkaisuja. Syy tähän on hyvin luonnollinen, sillä jakolaskussa täytyy olettaa g(y(x)) \neq 0. Huomataan kuitenkin, että jokaista funktion g(y) nollakohtaa \alpha vastaa DY:n y'=f(x)g(y) vakioratkaisu y(x)\equiv \alpha, koska tällöiny'(x)\equiv 0=g(\alpha)\equiv g(y(x)). Näitä ratkaisuja kutsutaan triviaaliratkaisuiksi tai erikoisratkaisuiksi (vrt. yleinen ratkaisu).

Jos seuraavan lauseen ehdot ovat voimassa, niin separoituvan DY:n  kaikki ratkaisut saadaan yleisen ratkaisun ja erikoisratkaisujen avulla.

Lause 2.

Tarkastellaan alkuarvotehtävää y'=f(x,y),\ y(x_0)=y_0.

  1. Jos f on jatkuva (kahden muuttujan funktio), niin on olemassa ainakin yksi ratkaisu jollakin pisteen x_0 sisältävällä välillä.
  2. Jos lisäksi f on jatkuvasti derivoituva muuttujan y suhteen, niin alkuarvotehtävän ratkaisu on yksikäsitteinen.
  3. Yksikäsitteisyys on voimassa myö silloin, kun kohdan (i) lisäksi funktio f on jatkuvasti derivoituva muuttujan x suhteen ja f(x_0,y_0)\neq 0.

Lauseen todistamisessa voidaan käyttää ns. Picardin-Lindelöfin iterointia, jonka keksi ranskalainen Emile Picard ja jota edelleen kehitti suomalainen mathemaatikko Ernst Lindelöf (1870-1946), ja muutkin.

Separoituvien DY:iden kohdalla edellinen lause saa seuraavan muodon.

Lause 3.

Tarkastellaan separoituvaa DY:ä y'=f(x)g(y), jossa f on jatkuva ja g on jatkuvasti derivoituva.

  1. Jokaista funktion g nollakohtaa \alpha vastaa triviaaliratkaisu y(x)\equiv \alpha = vakio.
  2. Kaikki muut ratkaisut (= yleinen ratkaisu) saadaan ainakin periaatteessa soveltamalla muuttujien erottelua, käytännössä vain silloin, jos integraalit pystytään laskemaan.

Jokaisen pisteen (x_0,y_0) kautta kulkeva ratkaisukäyrä on silloin yksikäsitteinen. Erityisesti kaksi ratkaisukäyrää ei voi leikata toisiaan, eikä yksi ratkaisukäyrä voi haarautua useampaan osaan.

∴ Muut ratkaisukäyrän eivät silloin voi leikata triviaaliratkaisujen kuvaajia eli vaakasuoria y=\alpha. Tällöin ehto g(y(x))\neq 0 on automaattisesti voimassa muille ratkaisuille.

Lause 6.

Ratkaistaan lineaarinen homogeeninen DY y'+p(x)y=0 separointimenetelmän avulla.

DY:llä on triviaaliratkaisu y_0(x)\equiv 0. Muut ratkaisut eivät saa arvoa 0, joten:

\begin{aligned}
		\frac{dy}{dx} &= y'= -p(x)y \\
		&\Leftrightarrow \int\frac{\mathrm{d}y}{y}  =  -\int p(x)\, \mathrm{d}x +C_1 \\
		&\Leftrightarrow \ln|y| = -P(x)+C_1 \\
		&\Leftrightarrow |y| =e^{C_1-P(x)} \\
		&\Leftrightarrow y=y(x)=\pm e^{C_1} e^{-P(x)} =Ce^{-P(x)}.\end{aligned}

Tässä lauseke \pm e^{C_1} on korvattu yksinkertaisemmalla kertoimella C\in\mathbb{R}.

\star Separoituvaksi muuntuvat DY:t

Some differential equations can made separable by using a suitable substitution.

i) ODEs of the form  y'(x)= f\Big(\frac{y(x)}{x}\Big).
Example 7.

Let us solve the differential equation  y'= \frac{x+y}{x-y}. The equation is not separable in this form, but we can make if separable by substituting  u = \frac{y}{x}, resulting to  y' = u + xu'. We get

  u + xu'= \displaystyle \frac{1+u}{1-u}.  

Separating the variables and integrating both sides, we get

  \displaystyle \int \frac{1-u}{1+u^2} \, \mathrm{d}u= \int \frac{1}{x} \, \mathrm{d}x

   \arctan{u} 
	- \displaystyle \frac{1}{2} \ln(u^2 +1)= \ln{x} + C.

Substituting   u = \frac{y}{x} and simplifying yields

   \displaystyle \arctan{\frac{y}{x}} = \ln{C\sqrt{x^2 + y^2}}.

Here, it is not possible to derive an expression for y so we have to make do with just the implicit solution. The solutions can be visualized graphically: 

As we can see, the solutions are spirals expanding in the positive direction that are suitably cut for demonstration purposes. This is clear from the solutions' polar coordinate representation which we obtain by using the substitution

\theta = \displaystyle \arctan{\frac{y}{x}}, r = \sqrt{x^2 + y^2}.

Hence, the solution is

\theta = \ln(Cr) \Leftrightarrow r = Ce^{\theta}.

ii) ODEs of the form \displaystyle y' = f(ax+by+c) 

Another type of differential equation that can be made separable are equations of the form 

\displaystyle y' = f(ax+by+c).

To rewrite the equation as separable, we use the substitution  \displaystyle u = ax+by+c.

Example 8.

Let us find the solution to the differential equation

\displaystyle y' =(x-y)^2 +1.

Here, a natural substitution is \displaystyle u = x-y \Leftrightarrow y = x-u \Rightarrow y' = 1-u'. Substitution yields

 \displaystyle 1-u' =u^2 +1

 \displaystyle \int -\frac{1}{u^2} \, \mathrm{d}u = \int \, \mathrm{d}x

 \displaystyle \frac{1}{u} = x +C

 \displaystyle y = x -  \frac{1}{x +C}.

\star Eulerin menetelmä

In practice, it is usually not feasible to find analytical solutions to differential equations. In these cases, the only choice for us is to resort to numerical methods. A prominent example of this kind of technique is called Euler's method. The idea behind the method is the observation made earlier with direction fields: even if we do not know the solution itself, we are still able to determine the tangents of the solution curve. In other words, we are seeking solutions for the initial value problem

 \left\{\begin{align}y' = f(x,y) \\ y(x_0) = y_0. \end{align} \right.

In Euler's method, we begin the solving process by choosing the step length  h and using the iteration formula

 \displaystyle y_{k+1} = y_k +  hf(x_k, y_k).

The iteration starts from the index  \displaystyle k=0 by substituting the given initial value to the right side of the iteration formula. Since f(x_k, y_k) = y'(x_k) is the slope of the tangent of the solution at x_k , on each step we move the distance expressed by the step length in the direction of the tangent. Because of this, an error occurs, which grows as the step length is increased.

Esimerkki 9.

Use the gadget on the right to examine the solution to the initial value problem

 \left\{\begin{align}y' = \sin(xy) \\ y(x_{0}) = y_{0} \end{align} \right.

obtained by using Euler's method and compare the result to the precise solution.

Interactive. The equation y'=\sin(xy) with the initial condition y(x_{0})=y_{0}. The precise solution is drawn blue while the solution obtained using Euler's method with N number of steps is drawn purple.

2. ja korkeamman kertaluvun DY


Korkeamman kertaluvun differentiaaliyhtälöille on usein mahdotonta löytää jollakin yksinkertaisella lausekkeella määriteltyä ratkaisua. Tässä luvussa käsitellään tiettyjä tärkeitä erikoistapauksia, joissa ratkaisun lauseke voidaan muodostaa. Nämä ovat kaikki lineaarisia differentiaaliyhtälöitä. Keskitymme toisen kertaluvun differentiaaliyhtälöihin, koska niillä on paljon sovelluksia ja myös niiden ratkaiseminen on helpompaa, vaikkakin teoriassa hyvin samanlaista kuin korkeampien kertalukujen tapauksessa.

Homogeenisen DY:n ratkaiseminen

Toisen kertaluvun lineaariselle differentiaaliyhtälölle ei ole mitään yleistä helppoa ratkaisutapaa. Aloitamme tarkastelun homogeenisesta DY:stä

 y’’ + p(x)y’ + q(x)y = 0,

kun p ja q ovat jatkuvia funktioita jollakin avoimella välillä. Tällöin pätee:

1) DY:llä on lineaarisesti riippumattomat ratkaisut y_1 ja y_2, joita kutsutaan perusratkaisuiksi. Intuitiivinen määritelmä lineaariselle riippumattomuudelle on se, ettei suhde y_2(x)/y_1(x) ole vakio, ts. ratkaisut ovat tietyssä mielessä olennaisesti erilaisia.

2) DY:n yleinen ratkaisu (= kaikki ratkaisut tässä tapauksessa) voidaan esittää perusratkaisujen avulla muodossa y(x) = C_1y_1(x) + C_2y_2(x) , kun  C_1 ja  C_2 ovat vakioita.

3) Jos kiinnitetään alkuehdot y(x_0) = a, y'(x_0) = b, niin ratkaisu on yksikäsitteinen.

Perusratkaisujen y_1(x) ja y_2(x) löytämiseen ei ole mitään yleispätevää menetelmää, ellei sarjakehitelmiä niiksi lasketa. Tietyille yhtälötyypeille ratkaisun yleinen muoto voidaan kuitenkin arvata ja tarkistaa sijoittamalla yhtälöön.

Yllä esitetty menetelmä yleistyy korkeampiin kertalukuihin, mutta perusratkaisuja, yleisiä kertoimia ja alkuehtoja tarvitaan aina DY:n kertaluvun osoittama määrä.

Esimerkki 1.

Differentiaaliyhtälön  y’’-y= 0 ratkaisuja ovat  y = e^x ja  y = e^{-x}. Nämä ovat lineaarisesti riippumattomia, joten DY:n yleinen ratkaisu on muotoa  y(x) = C_1e^x + C_2e^{-x}.

Vakiokertoimiset DY:t

Yksinkertaisimpana tapauksena tarkastellaan differentiaaliyhtälöä

 y’’ + py’ + qy = 0.

Yhtälön ratkaisemiseksi kokeillaan, onko sillä muotoa  y(x) = e^{\lambda x} olevia ratkaisuja jollakin vakion  \lambda arvolla. Sijoittamalla tällainen arvaus differentiaaliyhtälöön saadaan

 \lambda^2 e^{\lambda x} + p\lambda e^{\lambda x} + qe^{\lambda x} = 0.

 \lambda^2 + p\lambda + q = 0.

Viimeinen yhtälö on nimeltään DY:n karakteristinen yhtälö. Karakteristisen yhtälön avulla saadaan alkuperäisen DY:n ratkaisuja. Karakteristisen yhtälön juurten suhteen esiintyy kolme eri tapausta:

1) Karakteristisella yhtälöllä on kaksi erisuurta reaalista juurta \lambda_1\neq\lambda_2. Silloin perusratkaisuiksi voidaan valita y_1(x) = e^{\lambda_1x} ja y_2(x) = e^{\lambda_2x}.

2) Karakteristisella yhtälöllä on (reaalinen) kaksoisjuuri \lambda_1. Silloin perusratkaisuiksi voidaan valita y_1(x) = e^{\lambda_1 x} ja y_2(x) = xe^{\lambda_1 x}.

3) Karakteristisen yhtälön juuret ovat kompleksilukuja ja muotoa \lambda = a \pm bi, b\neq 0. Silloin perusratkaisut ovat muotoa y_1(x) = e^{ax}\cos(bx) ja y_2(x) = e^{ax}\sin(bx).

Toinen kohta voidaan perustella (esimerkiksi) sijoittamalla DY:ön ja kolmas kohta  Eulerin kaavan  e^{ix}=\cos x+i\sin x avulla. Sama idea yleistyy pienin muutoksin myös korkeampiin kertalukuihin.

Koska karakterisitisen yhtälön kertoimet ovat täsmälleen samat kuin alkuperäisessä DY:ssä, niin sitä ei tarvitse joka kerta johtaa uudelleen, vaan tuloksen voi kirjoittaa suoraan DY:tä katsomalla.

Esimerkki 2.

Ratkaise reuna-arvotehtävä

 \left\{\begin{align}y'' -y' +2y=0 \\ y(0) = 1, y(1)=0 \end{align} \right.

Karakteristinen yhtälö on muotoa \lambda^2 -\lambda -2 = 0, joten sen juuret ovat  \lambda_1 = 2 ja  \lambda_2 = -1. Yleinen ratkaisu on siis muotoa  y(x) = C_1e^{2x} + C_2e^{-x}. Vakiot kiinnittyvät reunaehtojen avulla:

 \left\{\begin{align}C_1 + C_2=1 \\ e^2C_1 + e^{-1}C_2 = 0 \end{align} \right.

 \left\{\begin{align}C_1 = -\frac{1}{e^3-1} \\ C_2 = \frac{e^3}{e^3-1} \end{align} \right.

Ratkaisu on siis  y(x) = \frac{1}{e^3-1} (-e^{2x} + e^{3-x}).

Esimerkki 3.

Tarkastellaan korkeamman kertaluvun DY:ä

 y^{(4)} - 4y''' +14y'' -20y' +25y = 0.

Karakteristinen yhtälö on nyt  \lambda^4 - 4\lambda^3 +14\lambda^2 -20\lambda +25 = 0, jonka juuret ovat  \lambda_1 = \lambda_2 = 1 + 2i ja  \lambda_3 = \lambda_4 = 1 - 2i. Perusratkaisut ovat e^x\sin(2x)e^x\cos(2x)xe^x\sin(2x) ja xe^x\cos(2x). Niiden avulla saadaan yleinen ratkaisu

 y = C_1e^x\sin(2x) + C_2e^x\cos(2x) + C_3xe^x\sin(2x) + C_4xe^x\cos(2x).

Esimerkki 4.

Olkoon  \omega >0 vakio. DY:n 
	y''+\omega^2y=0
	karakteristinen yhtälö on  \lambda^2+\omega^2=0, jonka juuret ovat  \lambda=\pm i \omega. Näin ollen  a =0 ja  b =\omega  kolmannessa kohdassa. Koska kyseessä on ns. harmonisen oskillaattorin DY, niin käytetään muuttujana aikaa  t. Näin saadaan yleinen ratkaisu 
	y(t)=A\cos (\omega t) +B\sin (\omega t),
	, jossa  A,B ovat vakioita. Ne määräytyvät yksikäsitteisellä tavalla, jos tiedetään systeemin alkukohta y(0) ja alkunopeus y'(0). Kaikki ratkaisut ovat jaksollisia ja niiden jaksonaika on T=2\pi/\omega. Oikean reunan animaatiossa  y'(0)=0; voit itse valita kulmataajuuden  \omega ja alkukohdan  y(0)=y_0.

Animaatio. Harmoninen oskillaattori y(t) = y_{0}\cos(\omega t),
kun t on aika sekunneissa.

Eulerin lineaarinen DY

Toinen melko tavallinen 2. kertaluvun lineaarinen DY on Eulerin differentiaaliyhtälö

 x^2y'' + axy' + by = 0,

jossa a ja b ovat vakioita. Tällainen DY voidaan ratkaista kokeilemalla muotoa y(x)= x^r. Sijoittamalla tämä yhtälöön saadaan

 r^2 + (a-1)r + b = 0.

Tämän yhtälön juurten tyypin perusteella saadaan DY:n perusratkaisut jälleen kolmesta eri vaihtoehdosta:

1) Jos juuret ovat erisuuria reaalilukuja, niin  y_1(x)= |x|^{r_1} ja  y_2(x)= |x|^{r_2}.

2) Jos kyseessä on reaalinen kaksoisjuuri, niin  y_1(x)= |x|^{r} ja  y_2(x)= |x|^{r}\ln |x|.

3) Jos juuret ovat muotoa r = a \pm bi, niin  y_1(x)= |x|^{a}\cos(b\ln |x|) ja  y_2(x)= |x|^{a}\sin(b\ln |x|).

Esimerkki 5.

Ratkaistaan DY  x^2y'' - 3xy' + y = 0. Kyseessä on  Eulerin differentiaaliyhtälö, joten kokeillaan yritettä y= x^r. Sijoittamalla saadaan  r(r-1)x^r - 3rx^r + x^r = 0 \Rightarrow r^2 - 4r + 1 = 0, joten  r = 2 \pm \sqrt{3}. DY:n yleinen ratkaisu on siis

y = C_1 x^{2+\sqrt{3}} + C_2x^{2-\sqrt{3}}.

Epähomogeeniset DY:t

Epähomogeenisen toisen kertaluvun DY:n

y'' + p(x)y' + q(x)y = r(x)

yleinen ratkaisu on muotoa "vastaavan homogeenisen DY:n yleinen ratkaisu" + jokin epähomogeenisen DY:n yksittäinen ratkaisu", t.s.

y(x) = C_1y_1(x) + C_2y_2(x) + y_0(x).

Yksittäisratkaisu y_0 löydetään yleensä kokeilemalla (mutta systemaattisiakin menetelmiä on) muotoa "r(x) yleisillä kertoimilla" olevia lausekkeita. Sijoittamalla tällainen yrite epähomogeeniseen DY:öön, voidaan nämä kertoimet usein ratkaista. Asia selvinnee parhaiten esimerkkien avulla.

Alla oleva taulukko antaa ohjeita yritteen valintaan silloin, kun homogeeninen osa on vakiokertoiminen ja epähomogeeninen termi on jotakin perustyyppiä.  Jos  r(x) sisältää useita erilaisia taulukon funktioita, niin yritteeseen tulee mukaan kaikki vastaavat termit yleisillä kertoimilla. Taulukossa käytetään lyhennysmerkintänä karakteristista polynomia P(\lambda)=\lambda^2+p\lambda+q=0.

r(x) sisältää
Yritteeseen tulee mukaan
n:nnen asteen polynomin\quad
A_0+A_1x+\dots +A_nx^n ( +A_{n+1}x^{n+1}, jos q=P(0)=0)
\sin kx,\ \cos kx
A\cos kx+B\sin kx, jos P(ik)\neq 0
\sin kx,\ \cos kx Ax\cos kx+Bx\sin kx, jos P(ik)=0
e^{cx}\sin kx,\ e^{cx}\cos kx\ Ae^{cx}\cos kx+Be^{cx}\sin kx, jos P(c+ik)\neq 0
e^{kx} Ae^{kx}, jos P(k)\neq 0
e^{kx} Axe^{kx}, jos P(k)=0 ja P'(k)\neq 0
e^{kx} Ax^2e^{kx}, jos P(k)=P'(k)=0

Huom. Muista, että toisen asteen polynomille pätee

  • P(k)=0 ja P'(k)\neq 0 \Leftrightarrow k\in\mathbb{R} on polynomin P yksinkertainen nollakohta.

  • P(k)=P'(k)= 0 \Leftrightarrow k\in\mathbb{R} on polynomin P kaksinkertainen nollakohta.

  • P(ik)\neq 0 \Leftrightarrow ik\in\mathbb{C} ei ole polynomin P nollakohta; t.s. \sin kx ja \cos kx eivät ole vastaavan homogeenisen DY:n ratkaisuja.

Esimerkki 6.

Määritä DY:n y''+y'-6y=r(x) yleinen ratkaisu, kun

a) r(x)=12e^{-x}

b) r(x)=20e^{2x}.

Ratkaisut ovat muotoa y(x)=C_1e^{-3x}+C_2e^{2x}+y_0(x).

a) Sijoitettamalla yrite y_0(x)=Ae^{-x}, saadaan (A -A -6A)e^{-x} =12e^{-x}, josta ratkeaa A=-2.

b) Tässä tapauksessa yrite Be^{2x} ei onnistu, koska se on vastaavan homogeenisen DY:n yleisen ratkaisun osa, ja tuottaa pelkän nollan, kun se sijoitetaan epähomogeenisen DY:n vasemmalle puolelle. Oikea yrite on nyt muotoa y_0(x)=Bxe^{2x}. Sijoittamalla saadaan


(4B+2B-6B)xe^{2x}+(4B+B)e^{2x} = 20e^{2x},

josta ratkeaa B=4.

Näillä vakioiden A ja B arvoilla saadaan epähomogeenisen DY:n yleinen ratkaisu, johon jää jäljelle kertoimet C_1 ja C_2.

Esimerkki 7.

Ratkaise DY y''+y'-6y=12e^{-x} alkuehdoilla y(0)=0, y'(0)=6.

Edellisen esimerkin perusteella yleinen ratkaisu on y(x)=C_1e^{-3x}+C_2e^{2x}-2e^{-x}. Derivoimalla saadaan y'(x)=-3C_1e^{-3x}+2C_2e^{2x}+2e^{-x}. Alkuehdoista saadaan yhtälöpari


\begin{cases}
0=y(0)=C_1+C_2-2 &\\
6=y'(0)=-3C_1+2C_2+2, &\\
\end{cases}

jonka ratkaisu on C_1=0 ja C_2=2. Alkuarvotehtävän ratkaisu on siis y(x)=2e^{2x}-2e^{-x}.

Example 8.

Tyypillinen 2. kertaluvun DY:n sovellus on ns. RLC-piiri, jossa esiintyy sarjaan kytkettyinä vastus (resistanssi  R), käämi ( induktanssi  L ), kondensaattori (kapasitanssi  C ) ja ajasta riippuva lähdejännite  E(t). Piirissä kulkeva virta  y(t) toteuttaa DY:n  Ly''+Ry'+\frac{1}{C}y=E'(t). Ratkaistaan tämä DY (keinotekoisilla kertoimilla) tapauksessa  y''+10y'+61y=370\sin t.

Homogeenisen DY:n karakteristinen yhtälö on  \lambda^2+10\lambda +61=0, jonka ratkaisut ovat  \lambda = -5\pm 6i. Näin saadaan homogeenisen DY:n perusratkaisut  y_1(t)=e^{-5t}\cos(6t) ja  y_2(t)=e^{-5t}\sin(6t) . Etsitään yksittäisratkaisu yritteellä y_0(t)=A\cos t +B\sin t. Sijoittamalla yrite epähomogeeniseen yhtälöön ja ryhmittelemällä termejä saadaan yhtälö  (60A+10B)\cos t +(60B-10A)\sin t = 370\sin t. Tämä yhtälö toteutuu kaikilla  t (vain) silloin, kun


\begin{cases}
60A+10B=0 &\\
-10A+60B=370, &\\
\end{cases}

josta saadaan  A=-1 ja  B=6. Yleinen ratkaisu on siis muotoa   y(t)=e^{-5t}(C_1\cos(6t)+C_2\sin(6t)) -\cos t+6\sin t . Huom. Eksponenttitermit menevät nollaan hyvin nopeasti ("transienttivirta") ja jäljelle jää värähtely  y(t)\approx -\cos t+6\sin t.

'); }],{ anchor : p1, anchorY : 'auto', fixed : true, parse : false, fontSize : 16, useMathJax : true }); var x0 = board.getBoundingBox()[0]; var x1 = board.getBoundingBox()[2]; var y0 = board.getBoundingBox()[3]; var y1 = board.getBoundingBox()[1]; var dy = function(x,y) { return Math.sin(x*y); } var f = function(x,yy) { return [dy(x,yy[0])]; } var ode = function() { var data = JXG.Math.Numerics.rungeKutta('euler', [p1.Y()], [p1.X(), x0], 201*(p1.X()-x0)/(x1-x0), f); data = data.reverse(); data = data.slice(0, -1); data = data.concat(JXG.Math.Numerics.rungeKutta('euler', [p1.Y()], [p1.X(), x1], 201*(x1-p1.X())/(x1-x0), f)); return data; } var graph = board.create('curve', [[0],[0]], { strokeColor : '#bd3fe0', strokeWidth : 2 }); graph.updateDataArray = function() { var data = ode(); var h = (x1-x0)/data.length; for(var i=0; i < data.length; i++) { graph.dataX[i] = x0+i*h; graph.dataY[i] = data[i][0]; } }; var slopes = []; var slopefield = function() { for(var x=x0; x<=x1; x=x+0.4){ for(var y=y0; y<=y1; y=y+0.4){ var k = dy(x,y); var length = 3*(2*Math.sqrt(1+k*k)); slopes.push(board.create('arrow', [ [x-1/length,y-k/length], [x+1/length, y+k/length] ],{ fixed : true, highlight : false, strokeOpacity : 0.55, strokeWidth : 1, strokeColor : '#2659f0' })); var yy = slopes[slopes.length-1].point1.Y() if(yy == 0){ slopes[slopes.length-1].setAttribute( { strokeColor : '#18d3af' }); } } } } slopefield(); board.fullUpdate(); })();
'); }],{ anchor : point, anchorY : 'auto', fixed : true, parse : false, fontSize : 16 })); board.create('functiongraph',[function(x) { return g(point,x); },x0,x1],{ strokeWidth : 3, strokeColor : color }); } for(var i=0;i
'); }],{ anchor : p1, anchorY : 'auto', fixed : true, parse : false, fontSize : 16 })); var stepNum = board.create('slider', [[1, 4],[4, 4],[1, 5, 25]],{ name : ' N', snapWidth : 1, precision : 0, fillColor : '#bd59ff', size : 8, withTicks : false, baseline : { strokeWidth : 2 }, highline : { strokeWidth : 4 }, label : { fontSize : 14 } }); /*var numTicks = board.create('ticks', [stepNum.baseline], { ticksDistance : 3/5, minorTicks : 0, majorHeight : 1 });*/ var x0 = board.getBoundingBox()[0]; var x1 = board.getBoundingBox()[2]; var y0 = board.getBoundingBox()[3]; var y1 = board.getBoundingBox()[1]; var dy = function(x,y) { return Math.sin(x*y); } var f = function(x,yy) { return [dy(x,yy[0])]; } var ode = function(interval, steps) { data = JXG.Math.Numerics.rungeKutta('euler', [p1.Y()], [p1.X(), interval], steps, f); return data; } var graph = board.create('curve', [[0],[0]], { strokeColor : '#4287f5', strokeWidth : 3, strokeOpacity : 0.5, dash : 2 }); graph.updateDataArray = function() { var data = ode(x0, 201*(p1.X()-x0)/(x1-x0)); data = data.reverse(); data = data.slice(0, -1); data = data.concat(ode(x1, 201*(x1-p1.X())/(x1-x0))); var h = (x1-x0)/data.length; graph.dataX = []; graph.dataY = []; for(var i=0; i < data.length; i++) { graph.dataX[i] = x0+i*h; graph.dataY[i] = data[i][0]; } }; var approx = board.create('curve', [[0],[0]], { strokeColor : '#bd59ff', strokeWidth : 3 }); approx.updateDataArray = function() { var n = stepNum.Value()+1; var h = a/(n-1); var data = ode(p1.X()+a, n); approx.dataX = []; approx.dataY = []; for(var i=0; i < n; i++) { approx.dataX[i] = p1.X()+i*h; approx.dataY[i] = data[i][0]; } p2.moveTo([approx.dataX[n-1],approx.dataY[n-1]]); }; coords.push(board.create('text',[0,0, function(){ return ('
~(x_{' + stepNum.Value() + '}, y_{' + stepNum.Value() + '})~
'); }],{ anchor : p2, anchorY : 'auto', fixed : true, parse : false, fontSize : 16 })); board.create('line',[[function(){ return p1.X(); },0],[function(){ return p1.X(); },function(){ return p1.Y(); }]],{ dash : 4, StrokeOpacity : 0.5, strokeColor : '#000000' }); board.create('line',[[function(){ return p1.X()+a; },0],[function(){ return p1.X()+a; },function(){ return p1.Y(); }]],{ dash : 4, StrokeOpacity : 0.5, strokeColor : '#000000' }); /*flunky. MathJax needs to be called last */ for(var i=0; i