Neuraaliverkkojen kokonaisvaltainen ymmärtäminen.
![](https://miro.medium.com/max/1280/0*nPckd5w-WZxAUPpV.png)
Koneoppimisessa, tai tarkemmin sanottuna neuroverkoissa, yksi yleisimmin käytetyistä aktivaatiofunktioista on sigmoidifunktio. Neuroverkon kouluttamisen backpropagation-vaiheessa on löydettävä häviöfunktion derivaatta kunkin verkon painon suhteen. Tätä varten on löydettävä aktivointifunktion derivaatta. Tämän artikkelin tarkoituksena on selvittää epäselvyyksiä sigmoidifunktion derivaatan löytämisestä.
Aluksi tässä on sigmoidifunktio:
![](https://miro.medium.com/max/60/1*h2mKSbkSqRmYi9OhHyWpKA@2x.png?q=20)
Kokeeksi ota laskimellasi sigmoidi 5:stä. Sinun pitäisi saada tulokseksi 0,99330714907.
Derivaattaa varten tämä funktio voidaan kirjoittaa myös seuraavasti:
![](https://miro.medium.com/max/60/1*XcZaBh3il0ooTtYChZTsiQ@2x.png?q=20)
Ensimmäinen asia, jonka huomasin tästä funktiosta, on se, että se on funktioiden koostumus. Ensimmäinen funktio on
![](https://miro.medium.com/max/60/1*bDiSa_0gjyaKffPGj-zsXg@2x.png?q=20)
ja toinen funktio on
![](https://miro.medium.com/max/60/1*1J0Oric7dnSzYlMb0oXHOA@2x.png?q=20)
Muistakaamme, että laskutoimituksessa, kun kyseessä on funktioiden kompositio, derivaatta, on ensimmäinen funktio toisen funktion suhteen kerrottuna toisella funktiolla muuttujan, tässä tapauksessa x:n, suhteen. Näin:
![](https://miro.medium.com/max/60/1*euGFm_1TRovvYQkje9BZ9g@2x.png?q=20)
Sigmoidifunktion derivaatta x:n suhteen on siis sigmoidifunktion derivaatta m:n suhteen kertaa m:n derivaatta x:n suhteen. Voit ajatella tätä funktioiden koostumissääntöä eräänlaisena välilaskutoimituksena, jonka tuloksena saadaan ristiin kumoamalla haluttu alkuperäinen derivaatta:
![](https://miro.medium.com/max/60/1*9qgk0QD8Agn7bw1x2G4BPg@2x.png?q=20)
Nyt kun tiedämme, että sigmoidi-funktio on funktioiden muodostama koostumus, meidän ei tarvitse tehdä muuta kuin löytääksemme derivaattamme,:
- Etsitään sigmoidifunktion derivaatta m:n, väliarvomme, suhteen
- Etsitään m:n derivaatta x:n suhteen
- Kerrotaan nämä arvot keskenään
Sigmoidifunktion derivaatta m:n suhteen
Katsotaanpa vielä kerran, miltä sigmoidifunktio näyttää m:n ollessa väliarvomme:
![](https://miro.medium.com/max/60/1*en0hcpeSaFAY8IbXm3vOwA@2x.png?q=20)
Tämän derivaatan löytäminen m:n suhteen on melko yksinkertaista, jos muistamme potenssisäännön:
![](https://miro.medium.com/max/60/1*ii-9jyo9DzjdvxD_NewuPA@2x.png?q=20)
X^n:n derivaatta on n kertaa x:n derivaatta potenssiin n-1.
Siten,
![](https://miro.medium.com/max/60/1*RRPcS47LvAXygCRQdxIVRQ@2x.png?q=20)
Nyt, jos korvaamme alkuperäisen m:n arvomme takaisin yhtälöön, saamme
![](https://miro.medium.com/max/60/1*YgwWo7IGFfHCI2QL8BE2JA@2x.png?q=20)
Loppujen lopuksi,
![](https://miro.medium.com/max/60/1*DSOvR25jPyjRLxZFQ5w2Qw@2x.png?q=20)
Yay! Suoritimme vaiheen 1.
Löydä m:n derivaatta x:n suhteen
Tässä on m:
![](https://miro.medium.com/max/60/1*HY6mNDzKbnm0KkL7BTqgFg@2x.png?q=20)
Johdannaisen löytämiseksi meidän on löydettävä jokaisen termin derivaatta x:n suhteen. Ensimmäinen termi on helppo:
![](https://miro.medium.com/max/60/1*xqN5kF3GuEhCyVuzlZ2qpQ@2x.png?q=20)
Toinen termi on hieman monimutkaisempi.
Päästetään
![](https://miro.medium.com/max/60/1*u6dIXvsIhIWvHXSAj3TPUQ@2x.png?q=20)
ja
![](https://miro.medium.com/max/60/1*NmjZIoawG2sIaj4aCAIrqg@2x.png?q=20)
.
Me tiedämme, että
![](https://miro.medium.com/max/60/1*yJaPKPIIqNpfV8zHw_XTwA@2x.png?q=20)
Jos e^u:n saaminen ei ole selvää, lukekaa tämä.
Käytetään nyt jälleen kerran ketjusääntöä,
![](https://miro.medium.com/max/60/1*FcQNYyN8wm69ZPQlcXZYkQ@2x.png?q=20)
Kerrotaan siis vain nuo äsken laskemamme derivaatat, jotta saadaan derivaatta x:n suhteen:
![](https://miro.medium.com/max/60/1*9hhIYJlrrEnX9jA9j5P2wA@2x.png?q=20)
Kaikki vaiheessa 2,
![](https://miro.medium.com/max/60/1*oQbxRgKqYbPcLDpLuCAkzw@2x.png?q=20)
Kerroin derivaatat
Muistetaan, että kun löysimme kaksi välijohdannaista, meidän piti kertoa ne. Tässä siis nopea yhteenveto:
![](https://miro.medium.com/max/60/1*aTlg-GrkdIkD05aV349w4g@2x.png?q=20)
Nyt, jos muistat miten kerrotaan :), voimme vihdoin lopettaa tämän!
![](https://miro.medium.com/max/60/1*gCzsgoQkdQVVjJi8G5l9uA@2x.png?q=20)
Voit nyt ottaa tämän arvon ja käyttää sitä sigmoidifunktion derivoinnissa. Mielenkiintoinen asia tapahtuu kuitenkin sen jälkeen, kun olet manipuloinut tätä tulosta. Osoittautuu, että voit kirjoittaa derivaatan uudelleen näin:
![](https://miro.medium.com/max/60/1*HL-p9alkMl4EvVAGNTS9bQ@2x.png?q=20)
Sigmoidifunktion derivaatta on sigmoidi kertaa 1 miinus sigmoidi. Wow. Tunnen itseni huijatuksi. 🙂
Vastaa