En 2014, on observait sur le marché de l’emploi l’apparition d’une nouvelle tendance, celle du recrutement en Big Data. La demande des entreprises est déjà très forte mais va encore s’intensifier dans les années à venir. Objectif pour les entreprises : acquérir les compétences pour les enjeux du Big Data, et notamment cibler les fameux Data Scientists, si recherchés par les temps qui courent.
2015 confirme la tendance du Recrutement en Big Data
Un an après, nous voulons montrer, à travers une série d’interview de responsables de formations universitaires, que les recrutement en Big Data sont plus que d’actualité. La première interview que nous avons le plaisir de vous proposer est celle de Jamal Atif, Professeur des Universités et Responsable du Master Informatique Décisionnelle à LAMSADE, Université Paris Dauphine.
« Monsieur Atif, pouvez-vous, vous présenter en quelques mots ?
Je suis Professeur des Universités en informatique, spécialiste en « sciences des données ». Je suis titulaire d’un doctorat et d’une habilitation à diriger des recherches de l’Université Paris Sud. J’ai exercé mes fonctions d’enseignant-chercheur à l’université Paris-Sud, à Télécom-ParisTech, à l’université des Antilles et de la Guyane ou encore à l’Institut de Recherche pour le Développement (IRD).
J’ai aussi exercé des fonctions d’animation d’équipe que ce soit à l’IRD ou à l’université Paris Sud où j’ai été responsable adjoint de l’équipe « Apprentissage et Optimisation » du Laboratoire de Recherche en Informatique. Mes travaux de recherche portent ou ont porté sur l’apprentissage automatique, la représentation des connaissances et le raisonnement par approches approches logiques, la théorie de l’information ou encore les statistiques non-paramétriques. Ces travaux ont eu comme champ d’application principal la cartographie cérébrale que ce soit au travers des données d’imagerie ou de signaux d’électroencéphalographie pour les Interfaces Cerveau-Machines.
Quel est votre rôle actuel pour l’université de Dauphine ?
Outre diriger le Master 2 « Informatique Décisionnelle », j’occupe la double fonction d’enseignant-chercheur. En tant qu’enseignant au département Mathématiques et Informatique des Organisations (MIDO), j’ai en charge les cours d’analyse de données, de data-mining et d’apprentissage automatique du L3 au M2.
En tant que chercheur, je suis membre du LAMSADE (Laboratoire d’Analyse et de Modélisation des Systèmes d’Aide à la Décision) où je participe à la structuration de la thématique des sciences des données.
Quelles sont les formations délivrées dans le domaine de la data à l’université Dauphine ?
A Dauphine, la data est présente sous plusieurs aspects dans différentes formations, notamment dans les spécialités recherche et professionnelle de la mention informatique des organisations. Dans la spécialité professionnelle, elle est par exemple centrale dans le Master « Informatique Décisionnelle » mais est présente dans les Masters MIAGE « Systèmes d’Information et Technologies Nouvelles » et « Informatique pour la Finance ».
Ces masters existent sous la triple formule : formation initiale, continue ou par apprentissage. Dans la spécialité recherche, le Master « Informatique : Systèmes Intelligents » prépare les jeunes chercheurs aux différentes problématiques des sciences des données : l’apprentissage automatique et l’extraction de connaissances, l’intelligence artificielle distribuée, les bases de données et le Web.
La data est aussi présente dans la mention Mathématiques de la Modélisation et de la Décision – Mathématiques Appliquées (MMD-MA) au travers des parcours recherche « Traitement Statistique de l’Information » (TSI) et « Mathématiques, Apprentissage et Sciences Humaines » (MASH).
Notons enfin que Paris-Dauphine organise depuis cette année un Certificat Data Science orienté vers la formation de professionnels aux technologies nouvelles de gestion et de traitement de très grandes masses de données (Big Data).
Les besoins technologiques dans les entreprises progressent très vite. Comment les formations comme la vôtre font-elles pour s’adapter à la nouvelle demande du marché ?
Les intervenants dans nos formations viennent à la fois du monde de l’entreprise et du monde de la recherche. Cela permet d’avoir ce double regard sur les problématiques en lien avec les données consistant à enseigner les dernières avancées émanant des travaux de recherches (souvent élaborés par les enseignants-chercheurs eux mêmes) et les nouvelles questions que posent leur application dans tel ou tel cas d’utilisation pratique.
Cet équilibre est primordial pour nous et Dauphine, pour y parvenir, a cette particularité de disposer à la fois de chercheurs reconnus internationalement dans le domaine des sciences des données et d’un réseau d’entreprises de premier niveau opérant dans le champ de la data.
Qu’est-ce qu’un Data Scientist et quels sont d’après vous les qualités nécessaires à un bon data Scientist ?
Un Data Scientist est un professionnel qui tout en maîtrisant les différents aspects de la gestion, la manipulation et le traitement de très grandes masses de données, possède une compétence et un savoir pointu dans l’un de ces aspects. Il maîtrise l’état de l’art des avancées émanant du monde de la recherche et est familier avec les dernières technologies de la gestion – au sens large – de très grandes masses de données.
En ce sens, il possède une double compétence Mathématiques-appliquées/Informatique. Il est souvent issu d’un Master 2 spécialisé en sciences de données et est de préférence titulaire d’un doctorat.
Un data scientist doit être capable de comprendre les problématiques métier, de les traduire en modèles mathématiques et de proposer des algorithmes pour la résolution de ces modèles. Ces algorithmes peuvent être issus de l’état de l’art ou résultant d’une recherche interne. Il a le souci du passage à l’échelle (solutions permettant de traiter des grandes masses de données), de la validation des méthodes au travers du benchmarking, et de la généricité des solutions, entre autres. Un data scientist doit aussi être capable de penser de nouveaux usages des données et est à cet égard au coeur l’innovation technologique.
Quel sont les principaux secteurs de recherche actuelles en lien avec le Big Data ?
Les problématiques de recherche en Big Data sont celles qui occupent le monde de la recherche depuis bientôt 20 ans, à savoir : les bases de données distribuées, le calcul distribué haute performance, la visualisation de très grandes masses de données et enfin l’apprentissage automatique (Machine Learning). Et j’en oublie certainement…
Concernant l’apprentissage automatique (Machine learning), champ de recherche au coeur de la mouvance Big Data, les recherches actuelles portent d’une part sur le passage à l’échelle des algorithmes classiques, mais aussi sur de nouveaux paradigmes d’apprentissage tels que les réseaux de neurones profonds, les espaces de représentation redondants ou encore l’apprentissage de préférences très utilisé dans les systèmes de recommandation par exemple. »
Propos recueillis par Alexandre Fiévé
Nous remercions Monsieur Atif d’avoir répondu à toutes nos questions et espérons que cela apportera des réponses aux entreprises qui recrutent et aux étudiants qui recherchent leur formation.
Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.