Para uma compreensão completa das redes neurais.
![](https://miro.medium.com/max/1280/0*nPckd5w-WZxAUPpV.png)
Uma das funções de ativação mais freqüentemente usadas na aprendizagem de máquinas, ou mais especificamente, redes neurais é a função sigmóide. Na etapa de retropropagação no treinamento de uma rede neural, você tem que encontrar a derivada da função de perda em relação a cada peso na rede. Para isso, você tem que encontrar a derivada da sua função de ativação. Este artigo visa esclarecer qualquer confusão sobre encontrar a derivada da função sigmóide.
Para começar, aqui está a função sigmóide:
![](https://miro.medium.com/max/60/1*h2mKSbkSqRmYi9OhHyWpKA@2x.png?q=20)
Para um teste, pegue a sigmóide de 5 na sua calculadora. Você deve obter 0,99330714907.
Para os fins da derivada, esta função também pode ser escrita como:
![](https://miro.medium.com/max/60/1*XcZaBh3il0ooTtYChZTsiQ@2x.png?q=20)
A primeira coisa que notei sobre esta função, é que ela é uma composição de funções. A primeira função sendo
![](https://miro.medium.com/max/60/1*bDiSa_0gjyaKffPGj-zsXg@2x.png?q=20)
> e a segunda sendo
![](https://miro.medium.com/max/60/1*1J0Oric7dnSzYlMb0oXHOA@2x.png?q=20)
Recorde isso em Cálculo, quando há uma composição de funções, a derivada, é a primeira função em relação à segunda multiplicada pela segunda função em relação à variável, neste caso x. Assim:
![](https://miro.medium.com/max/60/1*euGFm_1TRovvYQkje9BZ9g@2x.png?q=20)
Então, a derivada da sigmóide com respeito a x é a derivada da função sigmóide com respeito a m vezes a derivada de m com respeito a x. Você pode pensar nesta regra de composição da função como uma espécie de cálculo intermediário que resulta na derivada original que você queria por cancelamento cruzado:
>
![](https://miro.medium.com/max/60/1*9qgk0QD8Agn7bw1x2G4BPg@2x.png?q=20)
>>
Agora sabemos que a função sigmóide é uma composição de funções, tudo o que temos de fazer para encontrar a derivada, é:
>
- Passar a derivada da função sigmóide com respeito a m, nosso valor intermediário
- Passar a derivada de m com respeito a x
- Multiplicar esses valores juntos
Derivado da função sigmóide com respeito a m
Vejamos novamente como é a função sigmóide com m como nosso valor intermediário:
![](https://miro.medium.com/max/60/1*en0hcpeSaFAY8IbXm3vOwA@2x.png?q=20)
Para encontrar a derivada disto com respeito a m é bastante simples se nos lembrarmos da regra de potência:
![](https://miro.medium.com/max/60/1*ii-9jyo9DzjdvxD_NewuPA@2x.png?q=20)
>989898>
A derivada de x^n é n vezes a derivada de x para o poder de n-1.
So,
![](https://miro.medium.com/max/60/1*RRPcS47LvAXygCRQdxIVRQ@2x.png?q=20)
Agora, se substituirmos o nosso valor original de m de volta à equação, nós temos
![](https://miro.medium.com/max/60/1*YgwWo7IGFfHCI2QL8BE2JA@2x.png?q=20)
Finalmente,
![](https://miro.medium.com/max/60/1*DSOvR25jPyjRLxZFQ5w2Qw@2x.png?q=20)
Yay! Completamos o passo 1.
>
Passamos a derivada de m com respeito a x
Aqui m:
>
![](https://miro.medium.com/max/60/1*HY6mNDzKbnm0KkL7BTqgFg@2x.png?q=20)
>
Para encontrar a derivada, temos de encontrar a derivada de cada termo com respeito a x. O primeiro termo é fácil:
![](https://miro.medium.com/max/60/1*xqN5kF3GuEhCyVuzlZ2qpQ@2x.png?q=20)
O segundo termo é um pouco mais complicado.
>
Vamos deixar-nos
![](https://miro.medium.com/max/60/1*u6dIXvsIhIWvHXSAj3TPUQ@2x.png?q=20)
![](https://miro.medium.com/max/60/1*NmjZIoawG2sIaj4aCAIrqg@2x.png?q=20)
Sabemos que
![](https://miro.medium.com/max/60/1*yJaPKPIIqNpfV8zHw_XTwA@2x.png?q=20)
Se chegar ao e^u não estiver claro, por favor, leia isto.
Agora, usando novamente a regra da corrente,
![](https://miro.medium.com/max/60/1*FcQNYyN8wm69ZPQlcXZYkQ@2x.png?q=20)
Então, basta multiplicar as derivadas que acabamos de calcular para obter a derivada em relação a x:
![](https://miro.medium.com/max/60/1*9hhIYJlrrEnX9jA9j5P2wA@2x.png?q=20)
>
Tudo em resumo para o passo 2,
![](https://miro.medium.com/max/60/1*oQbxRgKqYbPcLDpLuCAkzw@2x.png?q=20)
Multiplicar as derivadas
Recall, que uma vez que encontramos as duas derivadas intermediárias, tivemos que multiplicá-las. Então, aqui está um resumo rápido:
![](https://miro.medium.com/max/60/1*aTlg-GrkdIkD05aV349w4g@2x.png?q=20)
>>
Agora, se você se lembrar como multiplicar :), podemos finalmente terminar isto!
![](https://miro.medium.com/max/60/1*gCzsgoQkdQVVjJi8G5l9uA@2x.png?q=20)
Pode agora tomar este valor e usá-lo como derivação da função sigmóide. Uma coisa interessante ocorre depois de manipular este resultado, no entanto. Acontece que você pode reescrever a derivada assim:
![](https://miro.medium.com/max/60/1*HL-p9alkMl4EvVAGNTS9bQ@2x.png?q=20)
A derivada da função sigmóide é o sigmóide vezes 1 menos o sigmóide. Uau. Eu me sinto enganado. 🙂
Deixe uma resposta