MARIE CHAVENT - MARS 2016 Née le 5 mai 1969, mariée, 2 enfants. Courriel : [email protected] Web : http://www.math.u-bordeaux1.fr/~machaven/ Thèmes de recherche : modélisation statistique, réduction de dimension et apprentissage statistique. Situation actuelle Maître de Conférences Hors Classe – HDR, Université de Bordeaux. Membre des équipes : - OptimAl, IMB (Institut de Mathématiques de Bordeaux), UMR 5251 - CQFD, INRIA Bordeaux Sud-Ouest. Parcours professionnelle 2014- Maître de Conférences, Université de Bordeaux, Collège Sciences et Technologie, UF Mathématique et interactions. 2007-2014 Maître de Conférences, Université Bordeaux 2, UFR Sciences et Modélisation. 1998-2007 Maître de Conférences, IUT Michel de Montaigne, Université Bordeaux 3. 1996-1998 ATER, Université Panthéon-Assas Paris-II. Diplômes 2008 Habilitation à diriger les recherches, Université Bordeaux 1. Contributions en classification automatique et en réduction de dimension. Rapporteurs : A. Bar-Hen (U. Paris Descartes), P. Besse (INSA Toulouse), G. Govaert (UTC). 1997 Doctorat de Mathématiques Appliquées, Université Paris-IX Dauphine. Analyse des données symboliques, une méthode divisive de classification. Rapporteurs : A. Guénoche (Institut de Mathématiques de Luminy), G. Saporta (CNAM) Directeurs de thèse : E. Diday (U. Paris IX) et Y. Lechevallier (Inria Rocquencourt) 1993 DEA MAI, Mathématiques Appliquées à l’Ingénierie, Université Paris-IX Dauphine. Responsabilités scientifiques et collectives Responsabilités nationales et locales 2015- Membre nommée à la commission nationale d’évaluation d’INRIA (CE INRIA). 2015- Responsable permanent de l’équipe INRIA CQFD. 2015- Elue au conseil de laboratoire de l’Institut Mathématique de Bordeaux (IMB) . 2011-2015 Membre élue au Conseil National des Universités (CNU) en 26ème section. 2007-2010 Membre élue au Conseil de la Société Française de Statistique (SFdS) en tant que secrétaire adjointe (2009-2010) et webmestre (2008-2009). 2004-2006 Elue au conseil du laboratoire de Mathématiques Appliquées de Bordeaux (MAB). Organisation de manifestations scientifiques 2016 Vice présidente du comité de programme des 5èmes Rencontres R, Toulouse. 2015 Membre du comité de programme des 22èmes rencontres de la Société Francophone de Classification. 2014 Membre du comité de programme des 3èmes Rencontres R, Montpellier. 2013- Co-fondatrice et co-organisatrice du groupe de lecture SMILING in Bordeaux (Statistical MachIne LearnING Reading Group). 2013 Membre du comité d’organisation de Statlearn’13, 8-9 avril à Bordeaux. 2012 Co-créatrice et présidente du comité d’organisation des Premières Rencontres R, Bordeaux. 2006-2007 Responsable du séminaire Probabilités-Statistique de l’Institut de Mathématiques de Bordeaux. 2009 Trésorière adjointe des 41èmes Journées de Statistique, 25-29 mai 2009 à Bordeaux. 2004 Présidente du comité d’organisation des 11èmes rencontres de la Société Francophone de Classification. Responsabilité pédagogique 2009-2014 Co-responsable de la spécialité de master Modélisation Statistique et Stochastique (Master MIMSE) de l’Université de Bordeaux. Comités de sélection et jurys 2016 Membre du jury du concours CR2 INRIA Nancy Grand-Est. 2014 Membre du jury du concours CR2 INRIA Bordeaux Sud-Ouest. 2011 Membre de trois comités de sélection MCF 26 (IUT de Vannes, Université de Poitiers, ISPED, Université Bordeaux 2). 2009 Membre d'un comité de sélection MCF 26 à l'Université Toulouse 1. 2008 Membre expert du jury du concours externe CNRS d’ingénieur d’étude. 2007-2008 Membre de la commission de spécialistes section 26 de l’Université Bordeaux. Relecture d’articles 2000- J’ai été rapporteur d’articles scientifiques a de nombreuses reprises (journaux : PLOS one, Electronic Journal of Applied Statistical Analysis, Advances in Data Analysis and Classification, Neural Processing Letters, Journal de la SFdS, Computational Statistics and Data Analysis, Pattern Recognition Letters, IEEE Trans. on Fuzzy System). 2004 Co-éditrice invitée du numéro spécial Classification et Fouille des Données de la Revue des Nouvelles Technologies de l'Information. Diffusion scientifique Programmes de recherche et contrats 2014- PEPS IMB-AMIES avec la startup Matchable : Prédiction de comportement de joueurs de jeux vidéos. -2- 2015-2016 Projet Labex CPU TIMIC : Analyse de graphe cérébral de connectivité au repos. 2013-2016 Contrat de collaboration de recherche entre l’Inria et la PME Evollis : Systèmes de recommandation bayésiens. 2014-2015 Projet InterLabex CPU-TRAIL : Analyses statistiques de bases de données multidimensionnelles d’imagerie cérébrale. 2011-2015 ANR ADAPTEAU du programme CEP&S: Adaptation aux Variations des Régimes Hydrologiques dans l’Environnement Fluvio-Estuarien de la Garonne-Gironde. 2010-2013 Projet région PSI : Psychology and Sounds Interactions. Prédiction de l’état de vigilance à partir de signaux électroencéphalographiques (EEG). 2010 Contrat de recherche Air Breizh-ARCANE/CENBG : Identification et recherche de la contribution de sources de particules fines sur l’agglomération de Saint Malo. 2010 Danone : contrat d’accompagnement du monitorat conseil de V. Kuentz. 2008-2009 Contrat de recherche VNF : Définition de la méthodologie statistique d’une enquête par sondage des navigants plaisanciers sur le canal des deux mers. 2004-2006 APR Particules du programme PRIMEQUAL : Développement de modèles sourcerécepteur adaptés à la quantification des sources de pollution atmosphérique. 2003 Contrat de recherche MAAPAR (Ministère de l'Agriculture, de la Pêche et des Affaires Rurale) : Traitement statistique des informations sur les incendies de forêts. 1999-2002 CEA-CESTA : Recherche de règles de décision par discrimination et régression non standard. 1995-1997 Projet européen SODAS : classification divisive et analyse de données symboliques. Développement de paquets R − Le paquet PCAmixdata Ce paquet est dédié à l'analyse factorielle de données mixtes. Il propose principalement une méthode d’ACP pour données mixtes (quantitatives et qualitatives) appelée PCAmix, une méthode de rotation orthogonale des composantes de PCAmix et une méthode d’AFM de données mixtes à l’intérieur des groupes. http://cran.r-project.org/web/packages/PCAmixdata/index.html − Le paquet ClustOfVar Ce paquet propose principalement deux méthodes de clustering de variables qui fonctionnent pour des données mixtes (quantitatives et qualitatives) et une méthode de type bootstrap pour l’aide au choix du nombre de cluster. Chaque cluster est caractérisé par une variable synthétique quantitative et ClustOfVar peut être utilisé comme outil de réduction de dimension et de recodage de données en données quantitatives, au même titre que PCAmix. http://cran.r-project.org/web/packages/ClustOfVar/index.html − Le paquet ClustGeo Ce paquet est dédié au clustering de données multivariées, pour lesquelles proximités géographiques sont connues. Ces contraintes géographiques sont intégrées dans une approche hiérarchique, un paramètre de d’importance de ces contraintes sur le résultats du clustering pouvant être calibré. http://cran.r-project.org/web/packages/ClustGeo/index.html − Le paquet divclust Ce paquet implémente DIVCLUS-T une méthode descendante de clustering hiérarchique basée sur une approche de bi-partitionnement monothétique permettant de lire le dendrogramme comme un arbre de décision. Cette méthode s'applique à des données quantitatives, qualitatives ou mixtes. https://github.com/chavent/divclust -3- Invitations • • • • • • • • • • • Nov. 2015 : Aout 2015 : Juin 2015 : Mai 2014 : Avril 2014 : Séminaire de l’IECL, Université de Lorraine. Exposé invité aux Rencontres des Jeunes Statisticiens Séminaire du MIA-T de l’INRA de Toulouse. Invité au GDR MASCOT-NUM, working meeting « Mixed-Data », IHP Paris. Exposé invité à la journée thématique de la SFC, Stratégies de Classification Non-Supervisées, IHP Paris. Janv. 2014 : Invitée une semaine à l’Université du Queensland, Australie. Fév. 2012 : Séminaire du SAMM, Paris 1. Juin 2008 : Conférence invitée COMPOSTAT2010, Porto, Portugal. Juin 2008 : Invitée au GT ECAIS, Journée Méthodes Statistiques et Pollution, INSA Rouen. Nov. 2008 : Séminaire du Master ECD, Université Lyon2. Janv. 2006 : Séminaire du LMA, Université de Pau. Collaborations pluridisciplinaires 2012 Application de la rotation orthogonale en Analyse des Correspondances Multiples en sociologie culturelle. Collaboration avec Z. Lakatos (Université Polytechnique et Economique de Budapest). 2 communications orales et publication des résultats dans sa thèse de doctorat. 2009 Application de la méthode DIVCLUS-T en comptabilité financière. Collaboration avec C. Bessieux-Ollier et E. Walliser de l’Université de Montpellier. 2 articles : Rev. Française de Gestion, Int. J. Account., Auditing and Performance Evaluation. 2008 Classification sous contraintes de contiguïté pour la définition d’échelles spatiales et le calcul d’indicateurs de risque phytosanitaire. Collaboration avec F. Vernier (Irstea) et Y. Lechevallier (Inria Rocquencourt). 1 article dans les actes de COMPSTAT 2008. 2007 Identification et quantification de sources de pollution par des méthodes de factorisation de matrices sous contraintes de positivité. Collaboration avec H. Guégan (ARCANE - CENBG). 2 articles : Environmetrics et CSBIGS. 2006 Application de la méthode DIVCLUS-T en comptabilité financière. Collaboration avec H. Stolowy (groupe HEC). 1 article à European Accounting Review. 2002 Elaboration de taxonomies de familles de végétaux à partir de la composition en acides gras de leurs feuilles. Collaboration avec S. Mongrand (laboratoire de Biogenèse Membranaire UMR 5200 CNRS). 2 articles à Phytochemistry. 2000 Etude de la contamination par le mercure de certaines catégories de poissons consommés en Guyane française. Collaboration avec A. Boudou et R. Maury Brachet (UMR CNRS 5805 EPOC). 1 chapitre de livre et un article à la Revue Modulad. 1999 Recherche d'une typologie de la peau humaine saine. Collaboration avec C. Guinot (CERIES) et M. Tenenhaus (groupe HEC). 1 article dans la Revue de Statistique Appliquée. -4- Encadrement doctoral et scientifique Encadrement d’ingénieurs et de post-doctorants 2015-2016 Encadrement du post-doctorat de Pascal Jacq Prédiction de comportements de joueurs de jeux vidéo. Financement : Start up Matchable et PEPS AMIES. 2015-2016 Encadrement d’un ingénieur sur le projet de recherche TIMIC : Alexandre Laurent Traitement multivarié en imagerie cérébrale de cohortes: Application à l’analyse de graphe cérébral de connectivité au repos. Financement : projet labex CPU. Co-encadrant : M. Jolliot (Groupe d'Imagerie Neurofonctionelle – GIN). 2014-2016 Encadrement du post-doctorat de Solveig Badillo Advanced statistical methods for analysis of multidimensional databases of human brain imaging. Financement : projet InterLabex CPU-TRAIL. Co-encadrants : J. Saracco (Inst. Polytech. Bordeaux et Inria), B. Mazoyer (Groupe d'Imagerie Neurofonctionelle – GIN). 2014-2015 Encadrement d’un ingénieur du SED Inria Bordeaux Sud-Ouest : Marc Fuentes Développement de DIVCLUS-T, logiciel de clustering descendant monothétique. Encadrement de thèses 2013-2016 Encadrement de la thèse d'Adrien Todeschini Elaboration et validation d'un système de recommandation bayésien. Financement : PME Evollis et INRIA. Co-encadrant : F. Caron (Université d'Oxford). 2012-2015 Encadrement de la thèse d'Amaury Labenne Méthodes de réduction de dimension pour la construction d’indicateurs de qualité de vie. Financement : ANR ADAPT'EAU et Irstea. Co-encadrants : V. Kuentz (Irstea), J. Saracco (Inst. Polytech. Bordeaux et Inria). Thèse soutenue en décembre 2015 à l'Université de Bordeaux. Amaury Labenne est actuellement développeur statisticien chez xlstat. 2010-2013 Encadrement de la thèse de Laurent Vézard Réduction de dimension en apprentissage supervisé. Application à l'étude de l'activité cérébrale. Financement : projet région Aquitaine PSI. Co-encadrants : P. Legrand (Université de Bordeaux et Inria), F. Faïta (Université de Bordeaux). Thèse soutenue en décembre 2013 à l'Université Bordeaux 1. Laurent Vézard est actuellement Data Scientist chez engineer chez Ezakus. 2006-2009 Encadrement de la thèse de Vanessa Kuentz Contribution à la réduction de dimension. Financement : bourse MENRT. Co-encadrant : Jérôme Saracco (Inst. Polytech. Bordeaux et Inria). Thèse soutenue en novembre 2009 à l’Université Bordeaux 1. Vanessa Kuentz est ingénieur de recherche à Irstea. -5- Enseignements J’ai effectué mes enseignements ces dernières années dans le collège Sciences et Technologie de l’Université de Bordeaux en licence MIASHS et dans le master MIMSE. Mon investissement pédagogique se traduit par la rédaction de nombreux supports de cours, de TD et de TP, tous disponibles sur ma page web (http://www.math.u-bordeaux1.fr/~machaven/teaching/). Cette année, j’ai en outre crée pour mes étudiants de master 2 un challenge (https://dl.dropboxusercontent.com/u/33935784/challenge_mimse_2015.html) dans le cadre de l’UE « Apprentissage statistique » réalisé avec le paquet R rchallenge (développé par Adrien Todeschini). J’encadre également chaque année deux à trois stages de master 2 ce qui me permet d’être contact avec les débouchés professionnels pour les étudiants et les pratiques des entreprises. Le tableau suivant donne la liste des mes principaux enseignements dans ces deux filières. Bases en Statistique TD (18h/groupe) L1 MIASHS (2008- ) Modélisation Statistique Cours (12h) + TD (18h) L3 MIASHS (2013- ) Modèles de Régression Cours (10h) + TD (12h) M1 MIMSE (2010-2011) Analyse de la Variance Cours (10h) + TD (12h) M1 MIMSE (2008-2009) Analyse des données quantitatives Cours (10h) + TD (12h) M1 MIMSE (2007-2011) Apprentissage automatique Cours (10h) + TD (10h) M2 MIMSE (2015-) Analyse des données qualitatives Cours (10h) + TD (10h) M2 MIMSE (2010-2013) Scoring Cours (14h) M2 MIMSE (2010- ) Logiciel SAS cours/TP (14h) M1 MIMSE (2009-2012) Projet Informatique 12h TD M2 MIMSE (2010-2012) TER 12h TD M1 MIMSE (2008-2009) Encadrement de stage de M2 1 à 3 / an M2 MIMSE Au préalable, j’ai assuré à des enseignements à l’IUT Michèle de Montaigne et à l’Université Panthéon-Assas en DEUG Sciences Economiques et AES. Il s’agissait principalement d’enseignements de mathématiques, statistiques, informatique : Statistique et informatique Cours-TD Filière Bibliothèques-Médiathèques, IUT Michel de Montaigne, Bordeaux 3 Analyse discriminante Cours-TD Master Modélisation UFR Sciences et Modélisation, Bordeaux 2 Statistiques Cours-TD Institut EGID (Environnement, Géo-Ingénierie et Développement), Bordeaux 3 Analyse des données Cours Master et DIU Médecine Tropicale, Bordeaux 2 Mathématiques TD DEUG Sciences Economiques, Paris II Statistiques TD DEUG AES, Paris II -6- Publications Mes principaux thèmes de recherche sont la modélisation statistique, la réduction de dimension et l’apprentissage statistique. Ma production scientifique consiste en 44 documents publiés, j’en indique le détail ci-dessous. Dans un souci d’exhaustivité, les travaux en cours qui donneront lieu dans les prochaines semaines à des soumissions à des journaux et conférences sont également mentionnés. Plusieurs des documents indiqués ci-dessous sont téléchargeables depuis ma page web dont l’adresse est http://www.math.u-bordeaux1.fr/~machaven/ Articles dans des revues à comité de lecture [1] Vézard, L., Legrand, P., Chavent, M., Faita-Ainseba, F., Trujillo, L., EEG classification for the detection of mental states, Applied Soft Computing 32, 113-131(2015). [2] Chavent, M., Girard, S., Kuentz, V. Liquet, B. Nguyen, T.M.N., and Saracco, J., A sliced inverse regression approach for data Stream. Computational Statistics 29, 1129-1152 (2014). [3] Kuentz-Simonet, V., Lyser, S., Candau, J., Deuffic, P., Chavent M., and Saracco, J. Une approche par classification de variables pour la typologie d’observations : le cas d’une enquête agriculture et environnement. Journal de la SFdS 154:2, 37-63, (2013). [4] Chavent, M., Kuentz., V., and Saracco, J., Orthogonal Rotation in PCAMIX. Advances in Classification and Data Analysis 6, 131-146, (2012). [5] Chavent, M., Liquet, B., Kuentz V., and Saracco, J., ClustOfVar: An R Package for the Clustering of Variables. Journal of Statistical Software 50, 1-16, (2012). [6] Josse, J., Chavent, M., Liquet B., and Husson, F., Handling missing values with Regularized Iterative Multiple Correspondence Analysis. Journal of classification 29, 91-116, (2012). [7] Chavent, M., Kuentz, V., Liquet B., and Saracco J., Sliced Inverse Regression for stratified population. Communications in Statistics - Theory and methods 40, 3857-3978, (2011). [8] Chavent, M., Liquet B. and Saracco J., A semiparametric approach for multivariate sample selection. Statistica Sinica 20, 513-536, (2010). [9] Chavent, M., Guégan, H., Kuentz, V., Patouille, B., and Saracco J., PCA and PMF based methodology for air pollution sources identification and apportionment. Environmetrics 20, 928-942, (2009). [10] Chavent, M. and Saracco J., Central tendency and dispersion measures for intervals and hypercubes. Communications in Statistics - Theory and methods 37, 1471-1482, (2008). [11] Chavent, M., Guégan, H., Kuentz, V., Patouille, B. and Saracco J., Air pollution sources apportionment in a french urban site. Case Studies in Business, Industry and Government Statistics journal 1, 119-129, (2007). [12] Chavent, M., Briant O., and Lechevallier, Y., DIVCLUS-T: a monothetic divisive hierarchical clustering method. Computational Statistics and Data Analysis 32, 687-701, (2007). [13] Chavent, M., Kuentz, V. and Saracco, J., Analyse en Facteurs : présentation et comparaison des logiciels SAS, SPAD et SPSS. La Revue Modulad 37, 1-30, (2007). [14] Chavent, M., De Carvhalo, F. de A.T., Lechevallier, Y., and Verde, R., New Clustering methods for interval data. Computational Statistics 21, 211-229, (2006). [15] Carvhalo, F. de A.T., Souza, R. M.C.R., Chavent, M., and Lechevallier, Y., Adaptative Hausdorff Distances and Dynamic Clustering of Symbolic Interval Data. Pattern Recognition Letters 27, 167-179, (2006). [16] Chavent, M., Carvhalo, F. de A.T., Lechevallier, Y., and Verde, R., Trois nouvelles méthodes de classification automatique de données symboliques de type intervalle. Revue de Statistique Appliquée 51, 5-29, (2003). -7- [17] Chavent, M. and Patouille, B., Calcul des coefficients de régression et du PRESS en régression PLS1. La Revue de Modulad 30, 1-9, (2003). [18] Chavent, M., Lacomblez, C., Boudou, A., and Maury-Brachet, R., Contamination par le mercure et classification d'espèces en écotoxicologie : approche classique, approche symbolique. La Revue Modulad 26, 19-32, (2001). [19] Chavent, M., Guinot, C., Lechevallier, Y., and Tenenhaus, M., Méthodes divisives de classification et segmentation non supervisée : recherche d'une typologie de la peau humaine saine. Revue de Statistique Appliquée 47, 87-99, (1999). [20] Chavent, M., A monothetic clustering method. Pattern Recognition Letters 19, 989-996, (1998). [21] Chavent, M. and Touati, M., Recodage et classification symbolique d'un tableau de données temporelles. Application à l'étude du comportement d'utilisateurs. Revue de Statistique Appliquée 45, 73-88, (1997). Articles dans des revues à comité de lecture d’autres disciplines [22] Bessieux-Ollier, C., Chavent, M., Kuentz V., and Walliser, E., The mandatory adoption of IFRS on intangibles: upheaval or inertia ? The case of France. Int. J. Accounting. Auditing and Performance Evaluation 8, 91-113, (2012). [23] Bessieux-Ollier, C., Chavent, M., Kuentz, V., and Walliser, E., L’adoption en France des normes IFRS relatives aux incorporels. Revue française de gestion 207, 93-110, (2010). [24] Guégan, H., Leminh, Q., Chavent, M., Patouille, B., and Bourquin P., Identification et Quantification des contributions relatives des sources de poussières fines en milieu urbain. Pollution atmosphérique 198-199, 197-204, (2008). [25] Chavent, M., Ding, Y., Fu, L., Stolowy, H., and Wang, H., Disclosure and determinants studies: An extension using the divisive clustering method. European Accounting Review 15, 181-218, (2006). [26] Mongrand, S., Badoc, A., Patouille, B., Lacomblez, C., Chavent M., and Bessoule J.J., Chemotaxonomy of the Rubiaceae family based on leaf fatty acid composition. Phytochemistry 66, 549-559, (2005). [27] Lacomblez, C., Chavent, M., and Patouille, B., Analyse des données statistiques en zone méditerranéenne. Préventique Sécurité 77, 8-11, (2004). [28] Mongrand, S., Badoc, A., Patouille, B., Lacomblez, C., Chavent, M., and Cassagne, C. Taxonomy of gymnospermae: multivariate analyses of leaf fatty acid composition. Phytochemistry 58, 101-115, (2001). Articles de conférences avec publication des actes [29] Vezard, L., Legrand, P., Chavent, M., Faita-Ainseba, F., Clauzel, J., Trujillo, L. (2014), Classification of EEG signals by evolutionary algorithm. In: Advances in Knowledge Discovery and Management Volume 4, F. Guillet , B. Pinaud , G. Venturini , D. Zighed (editors), Studies in Computational Intelligence, vol. 527, pp. 133-153, Springer. [30] Todeschini, A., Caron, F., and Chavent, M., Probabilistic Low-Rank Matrix Completion with Adaptive Spectral Regularization Algorithms. In NIPS 2013, 845-853, (2013). [31] Vézard, L., Legrand, P., Chavent, M., Faita-Ainseba, F., and Trujillo, L., Detecting mental states of alertness with genetic algorithm variable selection. In IEEE Congress on Evolutionary Computation 2013, 1247-1254, (2013). [32] Brito, P. and Chavent, M., Divisive Monothetic Clustering for Interval ans Histogram-valued Data. In ICPRAM 1, 229-234, SciTePress, (2012). [33] Vézard, L., Legrand, P., Chavent, M., Faita-Ainseba, F., and Clauzel, J., Classification de données EEG par algorithme évolutionnaire pour l'étude d'états de vigilance. In Revue des Nouvelles Technologies de l’Information 23, Hermann-Editions, 189-200, (2012). -8- [34] Chavent, M, Kuentz, V., and Saracco, J., A Partitioning Method for the clustering of categorical variables. In Classification as a Tool for Research, Springer, 90-99, (2010). [35] Chavent, M., Lechevallier, Y., Vernier, F., and Petit, K., Monothetic divisive clustering with geographical constraints. In COMPSTAT 2008, Physica-Verlag, 67-76, (2008). [36] Chavent, M. and Lechevallier, Y., Empirical comparison of a monothetic divisive clustering method with the Ward and the k-means clustering methods. In Data Science and Classification, Springer, 83-90, (2006). [37] Chavent, M., Normalized k-means clustering of hyper-rectangles. In: Proceedings of the ASMDA 2005, 670-677, (2005). [38] Chavent, M., An Hausdorff distance between hyper-rectangles for clustering interval data. In Classification, Clustering and Data Mining Applications, Springer, 333-340, (2004). [39] Chavent, M. and Lechevallier, Y., Dynamical Clustering of interval data. Optimization of an adequacy criterion based on Hausdorff distance. In Classification, Clustering and Data Analysis, Springer, pp. 53-60, (2002). [40] Chavent, M. and Stephan, V., From Generalization to clustering in the Relational Database Context. In KESDA 1998, Eurostat's collection Theme 9: Research and development, 105-117, (1999). Chapitres de livre [41] Legrand, P., Vezard, L., Chavent, M., Faita-Ainseba, F., Clauzel, J., Trujillo, L. (2014), Feature extraction and classification of EEG signals. The use of a genetic algorithm for an application on alertness prediction. In: Guide to Brain-Computer Music Interfacing, E. Miranda, J. Castet, B. Knapp (editors), pp. 191-220, Springer. [42] Chavent, M. (2007). Species Clustering via Classical and Interval Data Representation. In Selected contributions in data analysis and classification, Brito, P., Cucumel, G., Bertrand, P., Carvahlo, F. Eds., pp. 183-191, Springer. [43] Chavent, M. (2000). Criterion-Based Divisive Clustering for Symbolic Objects. In: Analysis of symbolic data, Bock, H.-H., Diday, E. Eds., pp. 299-311, Springer. [44] Chavent, M. and Bock H.H. (2000). Clustering Problem, Clustering Methods for Classical Data. In: Analysis of symbolic data, Bock, H.-H., Diday, E. Eds., pp. 294-299, Springer. Articles en préparation ou soumis [45] Chavent, M., Kuentz, V., Labenne, A., and Saracco, J., Multivariate analysis of mixed data: The PCAmixdata R package, arXiv:1411.4911 [stat.CO] [46] Chavent, M., Kuentz, V., Labenne, A., and Saracco, J., ClustGeo: Hierarchical Ascendant Clustering with Geographical Constraints (présenté aux JDS 2015). [47] Chavent, M., Fuentes M., Divisif monothetic clustering for mixed data (présenté aux rencontres R 2015). [48] Chavent, M., Sarraco, J., Clustering of variables for mixed data (présenté à School of Astrostatistics 2015). [49] Chavent, M., Chavent, G., Optimal algorithms for Sparse Group Block PCA. Communications 55 communications dans des conférences internationales (COMPSTAT, IFCS, ASMDA, Use!R, CARME) et nationales (Journées de Statistique, Rencontres R, SFC, AGROSTAT, JMS, EGC). La liste, les résumés et les transparents sont disponibles à l’adresse suivante : http://www.math.ubordeaux1.fr/~machaven/communications/ -9-