トレーニングセットとは、コンピュータが情報処理方法を学習するための材料である。 機械学習はアルゴリズムを使用し、人間の脳が多様な入力を取り込んで重み付けし、脳内、個々の神経細胞を活性化する能力を模倣している。 人工ニューロンは、このプロセスの多くをソフトウェアで再現します。機械学習とニューラルネットワークのプログラムは、人間の思考プロセスがどのように機能するかを非常に詳細にモデル化しています。 逐次決定木やその種のアルゴリズムでは、分類やその他の操作を行う生のテキストや英数字のデータの集合となる。 一方、画像処理やコンピュータビジョンに関連する畳み込みニューラルネットワークの場合、学習セットは大量の画像で構成されることが多い。 機械学習のプログラムは非常に複雑で高度なため、それらの画像のそれぞれについて繰り返し学習を行い、最終的には特徴や形状、さらには人や動物などの被写体を認識できるようになるという考え方です。 学習データは、システムが動作するための「餌」とも言えるもので、このプロセスには絶対に欠かせないものだ