Skip to main content
apprendre

Les différents types d’apprentissages en apprentissage automatique

Dans cet article, nous allons introduire différents types d’apprentissage utilisés en apprentissage automatique. Nous verrons l’apprentissage supervisé, non supervisé, semi-supervisé et par renforcement. Chaque type d’apprentissage à leur spécificité et son utilisé en fonction du problème que nous rencontrons.

Apprentissage supervisé

L’apprentissage supervisé ou supervised learning est une approche d’apprentissage où nous connaissons les données sur lesquels nous travaillons. Par exemple, dans le cas d’un classificateur d’images, nous allons avoir un ensemble de données labellisées. Ainsi, nous connaissons l’étiquette de chaque image. À partir de ces étiquettes, nous allons pouvoir apprendre à notre modèle les différentes catégories représentées. Ainsi, à chaque prédiction de notre modèle, nous pouvons lui dire s’il a donné une bonne prédiction ou s’il s’est trompé. De ce fait, notre système apprend de ses erreurs. Il va chercher à minimiser l’erreur en fonction des données que nous allons lui donner.

Généralement, dans un apprentissage supervisé, nous avons trois grands temps. Un temps d’apprentissage, où nous allons donner à notre modèle un ensemble de données, ou il pourra s’entraîner. Puis une phase de validation, où nous allons chercher à vérifier l’apprentissage de notre système. Pour ce faire, nous allons prendre un ensemble de données que nous n’avons jamais montrer à notre modèle. Puis, nous allons chercher à vérifier si notre modèle arrive à bien différencier les différentes catégories. Enfin, nous avons une phase de production où nous allons pouvoir utiliser notre système.

Apprentissage non supervisé

Dans un apprentissage non supervisé ou unsupervised learning, nous ne connaissons pas la catégorie d’appartenance de nos données. Contrairement à l’apprentissage supervisé, nous n’avons ici pas de label sur nos données. Ainsi, l’objectif va être, pour notre modèle, de repérer des similarités et, en fonction de celle-ci, de déterminer certaines données qui appartiennent à la même catégorie.

Pour illustrer ce type d’apprentissage, nous avons un ensemble de données d’une population d’animaux. Nous avons récolté un ensemble de caractéristiques comme leur âge, leur poids, leur taille… L’objectif va être de déterminer si certains animaux peuvent appartenir à la même espèce et ainsi les regrouper ensemble.

Nous mesurons la qualité d’une méthode de classification non supervisée par la capacité à notre modèle de découvrir certains motifs cachés.

Apprentissage semi-supervisé

L’apprentissage semi-supervisé ou semi-supervised learning se situe entre le supervisé et le non-supervisé. En effet, dans ce type d’apprentissage, nous avons un ensemble de données étiquetées et non étiquetées. Ce qui est intéressant avec cette méthode est que nous laissons une certaine liberté à notre modèle. En effet, nous lui donnons des données sur lesquelles il va pouvoir extraire différentes caractéristiques et sur d’autres, il va devoir trouver des caractéristiques qui lui permettent de s’améliorer.

Ce type d’apprentissage est intéressant lorsque nous avons énormément de données. En effet, cela peut être fastidieux d’étiqueter l’intégralité de nos données. Cette méthode d’apprentissage nous permet d’éviter ce problème.

Apprentissage par renforcement

Dans le cas de l’apprentissage par renforcement, nous allons avoir un agent présent dans un environnement où il sera amené à prendre des décisions. Notre agent va se retrouver dans une série d’états où il aura à sa disposition un ensemble d’actions. L’objectif de notre agent est de prendre la meilleure décision possible. Pour définir la meilleure action, nous allons attribuer à chaque actions une récompense positive ou négative. Ainsi, l’objectif pour notre agent est d’obtenir la meilleure récompense possible.

Pour illustrer ce type d’apprentissage, nous pouvons prendre le cas d’un aspirateur autonome. L’environnement dans lequel il se situe est la pièce et son objectif est de la nettoyer. Pour ce faire, on peut attribuer pour chaque position de la pièce une récompense lui indiquant qu’il n’a pas encore nettoyé cette partie. Une fois passer sur une position, nous lui attribuons une récompense négative lui indiquant qu’il n’est pas censé repasser sur la même position. On pourrait aussi imaginer que lorsque notre robot aspirateur passe de l’état en charge à l’état à besoin d’être chargé, il faut qu’il privilégie le chemin de retour à la borne de chargement.

Conclusion

Le choix d’un système d’apprentissage dépend de notre cas d’étude et des données que nous avons à notre disposition. En effet, si nous avons des données déjà étiquetées, il est intéressant d’utiliser un apprentissage supervisé. En revanche, si nous ne connaissons pas la catégorie d’appartenance de nos données, un apprentissage non supervisé sera le choix à prendre. Bien entendu, nous avons énuméré dans cet article les types d’apprentissages les plus courants. Il en existe d’autres et c’est toujours un domaine de recherche dans le secteur de l’apprentissage automatique à l’heure actuelle. Ainsi, n’hésitez pas à vous renseigner ou à partager vos connaissances dans les commentaires.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *