Introduction Approches principales Conclusion
Apprentissage semi-supervisé
Et le semi-supervisé là-dedans ?
Deux techniques opposées
Supervisé : on connaît parfaitement les données, mais souvent en
nombre insuffisant, d’où le problème de généralisation
Non-supervisé : on dispose d’une masse de données
non-étiquetées mais souvent sans connaissance autre
Semi-supervisé
On dispose de quelques données étiquetées,
ET de beaucoup de données non-étiquetées
Combinaison des avantages des deux méthodes
Les données étiquetées permettent de se faire une idée de la
structure de P(x)
Les données non-étiquetées aident à aborder le problème de la
généralisation