Il set di addestramento è il materiale attraverso il quale il computer impara come elaborare le informazioni. L’apprendimento automatico utilizza algoritmi – imita le capacità del cervello umano di prendere diversi input e pesarli, al fine di produrre attivazioni nel cervello, nei singoli neuroni. I neuroni artificiali replicano molto di questo processo con software – programmi di apprendimento automatico e reti neurali che forniscono modelli altamente dettagliati di come funzionano i nostri processi di pensiero umano.

Con questo in mente, i dati di allenamento possono essere strutturati in diversi modi. Per gli alberi decisionali sequenziali e questi tipi di algoritmi, sarebbe un insieme di testo grezzo o dati alfanumerici che vengono classificati o altrimenti manipolati. D’altra parte, per le reti neurali convoluzionali che hanno a che fare con l’elaborazione delle immagini e la visione del computer, il set di allenamento è spesso composto da un gran numero di immagini. L’idea è che, poiché il programma di apprendimento automatico è così complesso e sofisticato, utilizza un addestramento iterativo su ciascuna di queste immagini per essere in grado di riconoscere caratteristiche, forme e persino soggetti come persone o animali. I dati di addestramento sono assolutamente essenziali per il processo – possono essere pensati come il “cibo” che il sistema usa per funzionare.