Données de réseaux sociaux et organisationnelles : quel avenir

publicité
 Données de réseaux sociaux et organisationnelles : quel avenir pour la recherche en sciences sociales ? Compte rendu du petit déjeuner du 30 mars 2017 autour de l’ouvrage Multilevel Network Analysis for the Social Sciences sous la dir. d’Emmanuel Lazega et Tom A.B. Snijders, Springer, 2016 Autour de la publication de l'ouvrage Multilevel Network Analysis for the Social Sciences, co‐dirigé par Emmanuel Lazega et Tom A.B Snijders, le petit déjeuner réunit Jacques Bossonney d’IBM, Sophie Vulliet‐Tavernier de la CNIL, Martin Clavey, journaliste scientifique et Emmanuel Lazega pour débattre des enjeux de la réutilisation des données personnelles, y compris des données de réseaux sociaux et organisationnels. Ces données appartiennent de plus en plus à des acteurs privés, qui développent de leur côté des services d’étude et de recherche : comment la recherche publique en sciences sociales peut‐elle alors se positionner ? Emmanuel Lazega, sociologue, spécialiste de l’analyse de réseaux multiniveaux (sociaux et organisationnels) étudie les relations entre individus et entre organisations, ce qui nécessite des données décrivant les interdépendances et interactions entre les niveaux. De plus en plus, ces données des réseaux sociaux et organisationnels appartiennent aux géants du numérique qui les utilisent directement pour des analyses et de la recherche. En développant ces activités d’analyse, ces acteurs privés créent une sociologie privée. Pour les chercheurs académiques, alors que les méthodes d’analyse de réseaux sont de plus en plus sophistiquées, l’accès aux données devient, lui, de plus en plus difficile. Il y a donc un déséquilibre dangereux pour l’avenir des sciences sociales publiques qui en appellent à créer de nouvelles institutions pour réguler l’utilisation de ces données. Petit déjeuner du CSO – 30 mars 2017 Martin Clavey, journaliste scientifique et animateur du débat, demande si l’on peut réellement parler de concurrence entre la recherche académique et les analyses auxquelles se livrent ces entreprises. Emmanuel Lazega considère que ces entreprises développent de véritables programmes de recherche et que la recherche académique doit s’efforcer de suivre ces travaux et de se préoccuper de l’accès aux données, pour des raisons aussi bien scientifiques que citoyennes. Sophie Vulliet‐Tavernier, directrice des Relations avec le public et la recherche de la CNIL, partage le constat d’un déséquilibre entre les grands acteurs américains et les pays européens. Elle considère néanmoins que la situation peut évoluer favorablement. La CNIL est particulièrement vigilante à l’utilisation des données personnelles. Elle s’assure que leur collecte est loyale et licite, et notamment qu’elle est transparente pour l’utilisateur. Elle veille également au respect du principe de finalité (l’utilisation de données personnelles est autorisée pour un objectif précis), au principe de pertinence (corrélation entre les données collectées et la question de recherche) et elle contrôle l’anonymisation des données en France. Un dispositif réglementaire permet à la CNIL de contrôler, voire sanctionner, les grands acteurs du secteur numérique, au‐delà des frontières françaises. La Loi pour une République numérique (octobre 2016) a renforcé son pouvoir de sanction. Un nouveau règlement européen, le GDPR, entrera en vigueur en mai 2018 et modifiera les législations nationales, et donc la loi « Informatique et liberté ». La CNIL réfléchit aux effets de cette réglementation et aux nécessaires évolutions du droit français. Dans la culture américaine, les grandes entreprises sont relativement libres alors que les approches européennes prônent une régulation en amont et en aval de l’utilisation des données personnelles. Si la diffusion de ces dernières est encadrée, Martin Clavey demande par exemple s’il est possible de vendre l’analyse de ces données comme le proposent les GAFA (Google, Apple, Facebook, Amazon). La CNIL est particulièrement vigilante à l’exploitation que ces entreprises font des données personnelles et elle essaie d’obtenir que ces entreprises se conforment aux règles européennes. Sur la question de l’utilisation des données par le monde de la recherche, Camille Roth, qui a dirigé le programme Algopol au Medialab (projet ANR sur les dynamiques socio‐sémantiques du web) demande à préciser le rôle de la CNIL. Sophie Vulliet‐Tavernier indique que la CNIL travaille avec les équipes de recherche sur l’anonymisation des bases de données et le consentement des participants aux études. Il n’y a pas de règles a priori et un dialogue entre les équipes et la CNIL est nécessaire pour aboutir à une réponse adaptée aux méthodologies de recherche. Par ailleurs, la CNIL monte des partenariats avec de grands organismes du monde de la recherche pour réfléchir à l’utilisation des données personnelles. Au sein d’IBM Talent Acquisition & Optimization, le service de Jacques Bossonney propose aux grandes entreprises clientes d’identifier de bons candidats pour leurs directions, en travaillant à partir de LinkedIn et Viadéo. IBM achète les données de ces réseaux et utilise l’outil Watson pour analyser les profils des candidats et étudier leur adéquation avec la culture de l’entreprise et le poste à pourvoir. Emmanuelle Marchal, chercheuse au CSO s’interroge sur le positionnement de ce type de service par rapport aux chasseurs de tête. La spécificité de ce service est d’être basé sur une intelligence artificielle qui fournit une analyse culturelle pour évaluer l’adéquation entre un candidat et une entreprise recruteuse. Camille Roth demande si cette intelligence artificielle s’appuie sur les Petit déjeuner du CSO – 30 mars 2017 expériences passées de recrutement et si elle n'a pas tendance, du fait de ses mécanismes d'apprentissage supervisé, à homogénéiser et rechercher toujours les mêmes profils au recrutement. Jacques Bossonney indique que Watson s’appuie sur les CV des potentiels candidats, mais aussi sur des données fournies par les entreprises recruteuses. Il étudie les individus qui ont un profil équivalent à celui qu’il recherche pour voir leur performance et voir si un candidat comparable pourrait bien s’intégrer. Sophie Vulliet‐Tavernier demande si IBM utilise, pour cela, les données des réseaux sociaux. IBM traite, en premier lieu, les informations que les personnes déposent sur leurs pages, de type CV. Puis ils recoupent les informations contenues dans les CV avec d’autres données. Susan C. Schneider, professeur émérite à l’université de Genève, demande comment l’outil Watson analyse la culture d’entreprise. Jacques Bossonney indique qu’il raisonne à base d’ « archétypes » fondés sur des questionnaires diffusés aux employés des entreprises (« culture implicite » de l’entreprise) en plus des informations diffusées officiellement par la société (« culture explicite »). Enfin deux questions reviennent sur les enjeux sociétaux de l’utilisation des données personnelles par le monde, privé ou public, de la recherche. Une étudiante demande si, au‐delà des risques associés à l’utilisation de ces données par les entreprises du secteur privé, il n’existe pas aussi une menace quant à l’utilisation de ces données par les Etats. Sophie Vulliet‐Tavernier répond qu’en effet, les enjeux relatifs aux atteintes aux libertés et à la vie privée sont présents dans le secteur public comme dans le secteur privé. Une collègue de Sciences Po s’interroge sur la formation des chercheurs : sont‐ils compétents en informatique ou collaborent‐ils avec des informaticiens, ne serait‐ce que pour comprendre leurs pratiques mais aussi pour faire progresser la recherche ? Chez IBM, ce sont des spécialistes du comportement et non des informaticiens qui ont mis au point le programme qui fait fonctionner le robot/logiciel Watson. Les chercheurs en sciences sociales devraient en effet collaborer bien davantage avec les informaticiens. Petit déjeuner du CSO – 30 mars 2017 
Téléchargement