Setul de instruire este materialul prin care calculatorul învață cum să proceseze informațiile. Învățarea automată utilizează algoritmi – imită abilitățile creierului uman de a prelua diverse intrări și de a le cântări, pentru a produce activări în creier, în neuronii individuali. Neuronii artificiali reproduc o mare parte din acest proces cu ajutorul unor programe software – programe de învățare automată și de rețele neuronale care oferă modele extrem de detaliate ale modului în care funcționează procesele noastre de gândire umană.

În acest sens, datele de instruire pot fi structurate în diferite moduri. Pentru arborii de decizie secvențială și acele tipuri de algoritmi, ar fi un set de text brut sau date alfanumerice care sunt clasificate sau manipulate în alt mod. Pe de altă parte, pentru rețelele neuronale convoluționale care au legătură cu procesarea imaginilor și viziunea computerizată, setul de antrenament este adesea compus dintr-un număr mare de imagini. Ideea este că, deoarece programul de învățare automatizată este atât de complex și de sofisticat, acesta folosește antrenamentul iterativ pe fiecare dintre aceste imagini pentru a fi în cele din urmă capabil să recunoască trăsături, forme și chiar subiecți precum oameni sau animale. Datele de instruire sunt absolut esențiale pentru acest proces – pot fi considerate ca fiind „hrana” pe care sistemul o folosește pentru a funcționa.

.