3. ´etraitement des Donn´ees : Traitez les valeurs manquantes et normalisez
les caract´eristiques si n´ecessaire.
Exemple de Code Python
Voici un exemple de code Python :
1import pandas as pd
2import numpy as np
3from sk le arn . m odel _sel ecti on import train_test_split
4from sk le arn . l ine ar_m ode l import LinearRegression
5from sklearn.metrics import me an_sq uar ed _er ror , r2_ sco re
6
7# Charg er le jeu de d o n n e s
8da ta = pd . r ea d _c s v ( ’ ho usi ng . csv ’)
9
10 # Aff icher les p r e m i r e s lignes des d o n n e s
11 print ( d at a . he ad () )
12
13 # S p a r e r les c a r a c t r i s t i q u e s ( featur es ) et la cib le (
target)
14 X = data [[ ’ S up er fic ie ’ ,’ No mb re _d e_c ha mb re s ’ ,’Age ’,’
Distance_du_centre_ville’]]
15 y = dat a [ ’ Pr ix ’ ]
16
17 # Divis er les d o n n e s en ense mbles d ’ e n t r a n e m e n t et de test
18 X_ tr ai n , X_ te st , y _tr ai n , y_ tes t = t r ai n_ te st _ sp li t ( X , y ,
te st_si ze =0.2 , r and om_ sta te =42)
19
20 # C r e r un m o d l e de r g r e s s i o n l i n a i r e
21 model = LinearRegression()
22 mo de l . fit ( X_ tr ai n , y_ tra in )
23
24 # Faire des p r d i c t i o n s sur les d o n n e s de test
25 y_pred = model . p re dict ( X_test )
26
27 # C alc ul er l ’ er reu r qu adr at iq ue mo ye nn e ( MSE )
28 mse = me an _s qu ar ed _e rr or ( y_ tes t , y_p red )
29 print (f" E rr eur q ua dr ati qu e mo yen ne ( MS E ) : { mse :. 2 f} ")
30
31 # Cal culer le co eff ici ent de d t e r m i n a t i o n ( R ^2)
32 r2 = r 2_s co re ( y_ tes t , y_p red )
33 print (f" C oef fic ien t de d t e r m i n a t i o n (R ^2) : { r2 :.2 f} " )
Listing 1: Exemple de code Python
3.2 Exercice : Regroupement de Clients (Clustering)
•objectif Utiliser des techniques de clustering pour segmenter un en-
semble de clients en groupes bas´es sur leurs comportements d’achat.
Cela peut aider `a comprendre les diff´erents types de clients et `a
adapter les strat´egies marketing en cons´equence.
3