Les types de machine learning

Les 3 types de Machine Learning se chevauchent un peu et parfois sont un peu flous, un système d'IA peut parfois être difficile à placer dans une seule catégorie. C'est pour cette raison que les chercheurs ont commencé à utiliser le terme d'apprentissage semi-supervisé. Le Machine Learning est un processus qui alimente bon nombre des services que nous utilisons aujourd'hui comme Netflix, YouTube, Spotify, les moteurs de recherche comme Google, les flux de médias sociaux comme Facebook, Instagram et Twitter ou encore les assistants vocaux comme Siri et Alexa.

Dans tous ces cas, chaque plate-forme collecte la quantité la plus grande possible de données sur les utilisateurs (comme les genres de films qu'ils aiment regarder, les liens sur lesquels ils cliquent ou les statuts auxquels ils réagissent), et ensuite, elle utilise le Machine Learning pour prédire nos préférences.


L'apprentissage supervisé :

Dans l'apprentissage supervisé, qui est le plus courant, un humain indique au système comment catégoriser les données. Dans l'exemple qui suit, celui-ci choisit comme catégorie trois animaux (chien, chat et oiseau) et il conçoit un programme informatique qui triera les données d'entrées. Pour ce faire, un humain aura préalablement entraîné le système à reconnaître ces différentes animaux avant qu'il puisse fonctionner en autonomie.


L'apprentissage non supervisé :

Dans l'apprentissage non supervisé, l'humain ne choisit pas de catégories, c'est donc le système lui-même qui les créera. Les techniques non supervisées ne sont pas aussi répandues que celles supervisées car elles ont des applications moins évidentes.

Dans l'exemple qui suit, le système va interpréter les données d'entrées pour créer les catégories. Dans ce sens la machine n'a pas besoin de la phase d'entraînement comme c'est le cas pour l'apprentissage supervisé, elle est autonome dans la catégorisation.

Exemple :

Les supermarchés collectent des données sur le comportement d'achat de leurs clients (avec les cartes de fidélité). Pour mieux comprendre leurs clients, les supermarchés peuvent visualiser les données à l'aide d'un graphique où chaque client est représenté par un point et les clients qui tendent à acheter les mêmes produits sont placés plus proches les uns des autres. Le supermarché peut également utiliser le regroupement pour obtenir un ensemble de groupes de clients tels que les « amateurs d'aliments bonne santé », les « amateurs de poissons haut de gamme », les « amateurs de sodas et pizzas », etc. Notez que le Machine Learning regroupe uniquement les clients dans les clusters ou groupes, mais ne générera pas automatiquement les étiquettes des clusters ou groupes. Cette tâche est laissée à l'humain.

L'apprentissage par renforcement :

Enfin, nous avons l'apprentissage par renforcement, dernière frontière du Machine Learning. Un algorithme de renforcement apprend par essai et erreur pour atteindre un objectif clair. Le système est donc en capacité d'apprendre de ses erreurs. Il choisira ses actions en fonction de son expérience et tentera d'éviter les actions négatives et reproduire les actions positives.