A tréningkészlet az az anyag, amelyen keresztül a számítógép megtanulja, hogyan dolgozza fel az információkat. A gépi tanulás algoritmusokat használ – az emberi agy azon képességeit utánozza, hogy különféle bemeneteket fogadjon be és mérlegeljen, hogy aktivációkat hozzon létre az agyban, az egyes neuronokban. A mesterséges neuronok ennek a folyamatnak a nagy részét szoftverekkel – gépi tanulási és neurális hálózati programokkal – másolják le, amelyek rendkívül részletes modelleket nyújtanak arról, hogyan működnek az emberi gondolkodási folyamataink.

Ezt szem előtt tartva a képzési adatokat különböző módon lehet strukturálni. A szekvenciális döntési fák és az ilyen típusú algoritmusok esetében ez egy nyers szöveg vagy alfanumerikus adathalmaz lenne, amelyet osztályoznak vagy más módon manipulálnak. Másrészt a képfeldolgozással és számítógépes látással kapcsolatos konvolúciós neurális hálózatok esetében a képzési halmaz gyakran nagyszámú képből áll. Az ötlet lényege, hogy mivel a gépi tanulási program annyira összetett és kifinomult, az egyes képeken történő iteratív képzést alkalmazza, hogy végül képes legyen felismerni a jellemzőket, formákat és akár olyan tárgyakat is, mint az emberek vagy állatok. A képzési adatok elengedhetetlenül fontosak a folyamathoz – úgy tekinthetünk rájuk, mint a “táplálékra”, amelyet a rendszer a működéséhez használ.