Conférences

R&DV du Plateau Inria : "Big data, comment traiter des cas particuliers ?"

Chaque mois, de 10h00 à 11h30, ne manquez pas « Les R&DV du Plateau » organisés sur le Plateau Inria situé à EuraTechnologies. Une équipe de recherche Inria viendra à la rencontre des entreprises afin de soutenir le transfert de technologies vers l’écosystème régional. Inscrivez-vous à la session du jeudi 22 septembre 2016 consacrée au big data : comment traiter des cas particuliers ?

Venez découvrir un type particulier de «Big data»

Courbes de températures, courbes de croissance (à la bourse ou en médecine), spectres, données historiques, … Voici quelques objets dont l’analyse statistique essaie de répondre aux objectifs les plus divers : visualisation, prédiction, typologie (clustering), régression.

Le traitement de telles données fait appel à des techniques spécifiques connaissant un grand essor notamment depuis une vingtaine d’années : lissage, réduction de la dimension, modélisation stochastique. Ces données sont clairement un type particulier de “big data”. Dans cette présentation, nous allons illustrer à l’aide d'exemples les techniques de base pour l’analyse statistique de ce type de données avec le logiciel R.

Le principal objectif de l’équipe-projet Modal (commune avec le CNRS, l'Université Lille 1 et l'Université Lille 2*) est de concevoir des modèles traitant des données multi-variées complexes et / ou des données hétérogènes. Les cas types de données sont :

  • Des co-variables nominales avec des positions multi-variées ;
  • Des combinaisons de variables continues et nominales avec des positions hétérogènes.

D'autres co-variables complexes et répandus sont également source d'intérêt telles que les données ordinales, les données de rangs, et les intervalles de données.

A partir des modèles générés, une analyse statistique pratique et efficace reste à effectuer, ce conduisant au traitement des données (visualisation, clustering) et à son apprentissage (classification supervisée et semi-supervisée, estimation de densité).

Inscrivez-vous vite, le nombre de place est limité !