Descriptif
L'objectif est de former les futurs ingénieurs aux problèmes, méthodes et techniques liées à la découverte de nouvelles connaissances par l'exploration de l'immense univers des données numérisées. Il s'agit d'un ensemble de méthodes et techniques nouvelles et puissantes en science des données pour aider à comprendre le monde.
La motivation générale de la DA IODAA est de proposer une spécialisation en science des données qui complète et enrichit la formation des ingénieurs AgroParisTech en sciences du vivant et de l’environnement
(1) en fournissant les outils fondamentaux pour savoir tirer parti du monde de données digital (les analyser, les enrichir, les exploiter),
(2) en donnant des connaissances fondamentales sur la fouille de données et l’apprentissage machine pour assurer la maîtrise d'œuvre de projets en science des données, et
(3) en préparant au travail collaboratif et multidisciplinaire de synthèse de sources de données variées et multi-sources.
Toutes ces compétences sont recherchées dans de très nombreux secteurs d’activité et plus particulièrement dans les sciences du vivant et de l’environnement.
Organisation
- Le tronc commun (18 ECTS) est organisé autour des champs thématiques suivants :
1- Information et données.
Objectif: Comprendre les enjeux et méthodes en représentation des données et informations (base de données, entrepôt de données, système d’information décisionnel)
2- Algorithmique et programmation
Objectif : Acquérir les bases conceptuelles et théoriques en raisonnement algorithmique et programmation avancée ainsi qu’en complexité algorithmique indispensables à tout expert en science des données.
3- Intelligence Artificielle
Objectif: Comprendre les enjeux et méthodes en intelligence artificielle et plus particulièrement en apprentissage artificiel, fouille de données et outils d’aide à la décision.
4- Apprentissage automatique avancé
Approfondir ses connaissances en apprentissage artificiel avancé notamment sur les approches par réseaux de neurones profonds et en statistique en grande dimension. Acquérir les bases conceptuelles et théoriques pour comprendre l’état de l’art, les possibilités et limites des méthodes et techniques. Connaître les questions de la recherche actuelle.
- Des choix possibles :
Des champs thématiques spécifiques (ex. analyse d’images, analyse de sources textuelles, bioinformatique avancée, ...) peuvent être explorés par les élèves en suivant de manière optionnelle des modules des Masters AMI2B et Intelligence Artificielle de l’université Paris-Saclay.
- Un projet Fil Rouge (de novembre à février – environ 100h à l’emploi du temps – groupes de 4 ou 5) :
Ces enseignements théoriques sont complétés par une mise en pratique des connaissances et compétences acquises au travers d’un projet fil rouge donnant l’occasion de mettre en œuvre les concepts et méthodes clés présentés lors des enseignements théoriques sur des problèmes en sciences du vivant et de l’environnement et impliquant des systèmes complexes. On citera par exemple la reconnaissance automatique d’espèces végétales ou le traitement et l’analyse d’images IRM du cerveau.
- Un stage :
Enfin l'étudiant rejoint une organisation (entreprise ou laboratoire de recherche) pour les derniers 6 mois de la formation pour conduire une mission d'ingénieur.
Localisation : Palaiseau (FRANCE)
Objectifs
- Data Analyst, Data Scientist en entreprises quel que soit leur envergure ou leur domaine d’application ou dans le monde académique : chargé d’études spécialiste en fouille de données à source unique ou multiple, consultant.
La composante « Agro » du diplôme donnant un avantage dans les secteurs des sciences de la vie, de l’environnement, de l’agronomie, etc.
- Data Manager : Chargé de la récolte, la gestion et l’exploitation de données.
- Spécialiste de Business Intelligence, d’informatique décisionnelle
- Chercheur en Data Science dans des organismes de recherche
Effectifs minimal / maximal
7/22
Diplômes concernés
Domaines ParisTech
Système d'information - Modélisation.Compétences
- Savoir où et comment chercher de l'information digitale sur une question donnée
- Savoir utiliser les outils et méthodes de fouille de données pour extraire de l'information
- Savoir interagir avec une direction des services informatiques pour conduire un projet en science des données (i.e. organiser un datawarehouse, mettre en œuvre des techniques de fouille de données, utiliser des outils d'aide à la décision)
- savoir interagir avec des décideurs pour les aider à prendre des décisions sur la base d'informations extraites et synthétisées par des traitements informatiques et/ou statistiques
- suivre l'évolution des méthodes et techniques en science des données et participer à la conception de nouvelles méthodes
Mots-clés
Big data, Fouille de données, Apprentissage artificiel, Aide à la décision, Intelligence Artificielle, Web sémantiqueModalités d'acquisition
30 ECTS sont accordées sur la partie académique (enseignements et projets).
Chaque enseignement est évalué par des examens, travaux personnels et/ou projets ; de manière individuelle ou en groupes ; avec ou sans présentation orale.
30 ECTS sont accordées à la mission de 6 mois minimum en entreprise ou en laboratoire qui vient clore la formation (mars - septembre).
Cette formation est accessible de plein droit sous réserve du nombre de places aux élèves ingénieurs AgroParisTech. Des élèves ingénieurs d'autres écoles avec lesquelles AgroParisTech a signé un accord peuvent postuler pour suivre cette formation. Enfin des candidats admis au CS adossé à cette dominante peuvent suivre cette formation comme auditeur.
Composition du parcours
- IDF3A_IODAA_S3 De l'information à la décision par l'analyse et l'apprentissage Semestre 3
- IODAA-UE APA_ACSN Apprentissage artificiel avancé
- IODAA-UE_Prog Programmation pour la science des données
- IODAA-UE_Fouille Fouille de données et apprentissage automatique
- IODAA_05-UE_OPTION Master Option de spécialisation (AMI2B - IA)
- IODAA-UE_Angl Anglais
- IODAA-UE_IA_Solve Résolution de problèmes et décisions
- IODAA-UE_Proj Projet fil rouge
- IODAA-UE_WebSem Ontologies, Web sémantique, TAL
- IODAA-UE STATS Statistique en grande dimension
- IODAA-UE_BDA Bases de Données avancées : optimisation (AMI2B)
- IODAA-UE_PROJ-HAC Projet Hackathon reproductible pour les données massives omiques
- IODAA-UE_M.A.N Mise à niveau (Shell – Git – VsCode)
- IODAA_UE PARC 1 Parcours sciences des données
- IODAA_UC PARC 1 OPT 12 OPT 12 « Text Mining et Chat Bots » (IA)
- IODAA_UC PARC 1 OPT 14 OPT 14: MULTILINGUAL NATURAL LANGUAGE PROCESSING (IA)
- IODAA_UC PARC 1 OPT 6 OPT 6 “Apprentissage artificiel avancé (IA)
- IODAA_UE PARC 2 Parcours Bioinformatique
- IODAA_UC PARC 2 ANAL DYN Analyse dynamique des système biologique (AMI2B)
- IODAA_UC PARC 2 ANAL IM Analyse d'image en biologie (AMI2B)
- IODAA_UC PARC 2 Bioinfo Bioinformatique de l’ARN (AMI2B)
- IODAA_UC PARC 2 GENOM Génomique comparée (AMI2B)
- IODAA_UC PARC 2 METHOD Méthodologie de recherche clinique (AMI2Bà
- IODAA_UC PARC 2 Opti com Optimisation combinatoire (AMI2B)
- IODAA_UC PARC 2 SIMUL Simulation en biologie
- IODAA-UE_INFO - THEO Informatique Théorique (AMI2B)
- IDF3A_IODAA_S4 De l'information à la décision par l'analyse et l'apprentissage Semestre 4
- _3A_IODAA_STAGE Stage de fin d'études