
sur test. Attention au surapprentissage si trop de paramètres.
—ResNet18 : geler les premières couches, ne dégeler que la der-
nière couche fully connected. Obtenir >90% précision et rappel.
La matrice de confusion montre le danger : même un taux de FN
de 5% = des cas de pneumonie manqués.
—FN critiques : en santé, un faux négatif retarde le traitement.
Commenter avec lexemple dune opacité discrète que le modèle a
classée « normale ».
—Exemples commentés : images avec annotations manuelles :
« Poumon droit avec infiltrat très faible contraste, le modèle ne la
pas vu →amélioration possible avec augmentation de contraste
ou réglage de seuil ».
2 Finance Détection de fraude sur transac-
tions
Tâche : Classification binaire transaction légitime / frauduleuse.
Données : Credit Card Fraud Detection 284 807 transactions anonymi-
sées (ACP), 0,17% de fraudes.
2.1 Objectifs
— Gérer un déséquilibre de classes extrême.
— Comparer techniques de rééchantillonnage et pondération.
— Définir une matrice de coût et optimiser le seuil de décision.
2.2 Questions
1. Analyser le déséquilibre. Appliquer une sous-échantillonnage aléatoire
de la classe majoritaire pour obtenir un ratio 50/50, et un sur-échantillonnage
avec SMOTE. Conserver un jeu de test intact.
2. Entraîner une régression logistique avec pondération des classes class_weight=balanced.
Comparer avec les deux techniques de rééchantillonnage (modèle entraîné
sur données équilibrées).
3. Évaluer : AUC-ROC, rappel de la classe fraude, et définir une matrice de
coût (ex. : coût FP = 10 , coût FN = 500 ). Calculer le coût total sur le
test.
5