Para uma compreensão completa das redes neurais.
Uma das funções de ativação mais freqüentemente usadas na aprendizagem de máquinas, ou mais especificamente, redes neurais é a função sigmóide. Na etapa de retropropagação no treinamento de uma rede neural, você tem que encontrar a derivada da função de perda em relação a cada peso na rede. Para isso, você tem que encontrar a derivada da sua função de ativação. Este artigo visa esclarecer qualquer confusão sobre encontrar a derivada da função sigmóide.
Para começar, aqui está a função sigmóide:
Para um teste, pegue a sigmóide de 5 na sua calculadora. Você deve obter 0,99330714907.
Para os fins da derivada, esta função também pode ser escrita como:
A primeira coisa que notei sobre esta função, é que ela é uma composição de funções. A primeira função sendo
> e a segunda sendo
Agora sabemos que a função sigmóide é uma composição de funções, tudo o que temos de fazer para encontrar a derivada, é:
>
- Passar a derivada da função sigmóide com respeito a m, nosso valor intermediário
- Passar a derivada de m com respeito a x
- Multiplicar esses valores juntos
Derivado da função sigmóide com respeito a m
Vejamos novamente como é a função sigmóide com m como nosso valor intermediário:
Para encontrar a derivada disto com respeito a m é bastante simples se nos lembrarmos da regra de potência:
>989898>
A derivada de x^n é n vezes a derivada de x para o poder de n-1.
So,
Agora, se substituirmos o nosso valor original de m de volta à equação, nós temos
Finalmente,
Yay! Completamos o passo 1.
>
Passamos a derivada de m com respeito a x
Aqui m:
>
>
Para encontrar a derivada, temos de encontrar a derivada de cada termo com respeito a x. O primeiro termo é fácil:
O segundo termo é um pouco mais complicado.
>
Vamos deixar-nos
Sabemos que
Se chegar ao e^u não estiver claro, por favor, leia isto.
Agora, usando novamente a regra da corrente,
Então, basta multiplicar as derivadas que acabamos de calcular para obter a derivada em relação a x:
>
Tudo em resumo para o passo 2,
Multiplicar as derivadas
Recall, que uma vez que encontramos as duas derivadas intermediárias, tivemos que multiplicá-las. Então, aqui está um resumo rápido:
>>
Agora, se você se lembrar como multiplicar :), podemos finalmente terminar isto!
Pode agora tomar este valor e usá-lo como derivação da função sigmóide. Uma coisa interessante ocorre depois de manipular este resultado, no entanto. Acontece que você pode reescrever a derivada assim:
A derivada da função sigmóide é o sigmóide vezes 1 menos o sigmóide. Uau. Eu me sinto enganado. 🙂
Deixe uma resposta