Données Scientifiques
Comparatif avec le “Big Data” commercial
Google / Facebook / Amazon / etc… Votre manip / terrain / mesures physio /…
Finalité = gagner des sous
– Données mesurées = toutes vos traces
– Modèles comportementaux
robustes ⇒ profilage utilisateur
– Demandes des investisseurs/clients
à prendre en compte
– Services rendus aractifs ⇒ publicité
Finalité = comprendre ce qui se passe
– Données mesurée selon hypothèses/modèle
ou question scientifique précise
– Connaissances disciplinaires à prendre en
compte:physique, biologie, etc.
– Faire mieux que l’état de l’art, dose d'inconnu
– Publications
Moyens disponibles
– Jeu d’entraînement, validation
«illimités»
– Puissance de calcul «illimitée»
Moyens disponibles
– Mesures de référence
= votre temps / argent du labo
– Votre laptop, un PC ou le cluster du labo
Objectifs très variés mais, de façon générale, il est utile de :
- Trouver les points intéressants (statistiques ≠ bruit de fond, anomalies ou pas)
- Aux échelles intéressantes (pas forcément celle d'acquisition)
- Et modéliser leur dynamique (diérents formalismes, pas tous appropriés)