Apprenti Data Engineer/Scientist

Référence du poste : DATA-Appr-2026-01

Cette offre vous intéresse ?

Nous rejoindre

Vous avez envie de faire carrière au sein d'un organisme public qui a pour mission de protéger efficacement la santé des populations ? Rejoignez-nous.

Santé publique France est l’agence nationale de santé publique française. Etablissement public de l’Etat sous tutelle du ministre chargé de la santé, issu de la fusion de plusieurs établissements publics, créé par l’ordonnance 2016-246 du 15 avril 2016, l’agence intervient au service de la santé des populations. Agence scientifique, d’expertise et de sécurité sanitaires, elle a pour missions :

  1. L'observation épidémiologique et la surveillance de l'état de santé des populations ; 
  2. La veille sur les risques sanitaires menaçant les populations ; 
  3. La promotion de la santé et la réduction des risques pour la santé ; 
  4. Le développement de la prévention et de l'éducation pour la santé ; 
  5. La préparation et la réponse aux menaces, alertes et crises sanitaires ; 
  6. Le lancement de l'alerte sanitaire.
     

L’agence est organisée autour de 12 directions scientifiques, transversales ou assurant le soutien à l’activité.

Les orientations stratégiques de l’agence et son programme de travail, arrêtés par son Conseil d’administration, se déclinent en trois axes : Consolider la capacité d’anticipation et de réponse réactive pour faire face aux menaces sanitaires ; Mesurer et évaluer l’ampleur des maladies et des facteurs de risques pour guider leur prévention et leur contrôle ; Renforcer l’impact sur la santé dans toutes les politiques publiques et la prévention et promotion de la santé.

Direction Appui, Traitements et Analyses des données

Mission

La direction DATA mène plusieurs projets stratégiques visant à moderniser les chaînes de traitement des données issues des systèmes de surveillance de Santé publique France. Ces projets s’appuient sur des approches innovantes en data ingénierie/science pour répondre aux enjeux de santé publique, notamment à travers la modélisation prédictive, l’intelligence
artificielle et l’analyse avancée de données massives. Trois systèmes majeurs illustrent cette dynamique :

  • Le programme SurSaUD assure une surveillance syndromique en temps réel en exploitant les données des urgences hospitalières, de SOS Médecins et des certificats de décès.
  • Les Maladies à Signalement obligatoire (MSO) suit en temps réel des pathologies à fort impact sanitaire grâce à la collecte systématique et à l’analyse des déclarations transmises par les professionnels de santé.
  • Le projet Orchidée déploie une surveillance épidémiologique multi-thématique à partir des données hospitalières

Activités

Ces données permettent de générer un volume important de séries temporelles, décrivant l’évolution d’indicateurs de santé à différentes échelles spatio-temporelles. Leur structuration et leur analyse représentent un enjeu stratégique pour renforcer les capacités de surveillance, de modélisation et d’alerte.

Dans ce contexte, la Direction DATA a engagé un projet visant à construire une chaîne de traitement automatisée, fiable et évolutive, permettant de valoriser ces données au moyen de méthodes avancées de traitement et d’analyse.

L'apprenti interviendra sur l'ensemble de la chaîne de traitement des données, depuis la collecte jusqu'à la production et la mise à disposition d'indicateurs. Ce dernier participera entre autres aux activités suivantes :

  • Concevoir, développer et maintenir des systèmes de gestion de données et des pipelines automatisés couvrant l’ensemble du cycle de traitement et de restitution des données.
  • Nettoyer, structurer et préparer des données, en garantissant leur qualité, leur fiabilité, leur traçabilité et leur conformité aux exigences réglementaires.
  • Explorer et proposer des solutions technologiques pour faire progresser la qualité et la fiabilité des données.
  • Identifier les possibilités d'acquisition et d’intégration de nouvelles sources de données.
  • Concevoir, développer et optimiser des méthodes statistiques et d’apprentissage automatique et profond pour la construction d’indicateurs épidémiologiques, la détection de signaux et la modélisation prédictive.
  • Développer des outils de monitoring et de restitution (API, tableaux de bord interactifs, rapports automatisés) pour répondre aux besoins opérationnels et stratégiques de l’agence.
  • Identifier et intégrer de nouvelles sources de données, ainsi que des approches technologiques émergentes (IA, traitement distribué, etc.) pour enrichir les analyses et renforcer la réactivité en situation de crise.
  • Travailler en étroite interaction avec des épidémiologistes, biostatisticiens et ingénieurs pour traduire les besoins métiers en solutions techniques robustes.
  • Rédiger des notes méthodologiques, contribuer à la valorisation des résultats (bulletins, rapports d’études et articles scientifiques) et former les équipes à l’utilisation des outils développés.

Ces activités s'intègrent dans un environnement technique dynamique et collaboratif, mobilisant des outils de développement modernes, des langages adaptés à la science des données, et des infrastructures de calcul performantes. L'apprenti évoluera au sein d'une équipe pluridisciplinaire, en interaction étroite avec des épidémiologistes, data scientists, statisticiens, ingénieurs et membres de la DSI ainsi que le RSSI.

Les principaux outils et technologies mobilisés incluent :

  • Langages : Python, R
  • Environnement collaboratif : GitLab (versionning, intégration continue, gestion des issues)
  • Automatsation et orchestration : Apache Airflow (déploiement, supervision des workflows), Docker
  • Formats et bases de données : PostgreSQL, DuckDB, fichiers Parquet, CSV
  • Visualisation : Quarto, Shiny (R et Python)
  • Environnements de développement : VS Code, RStudio, IA Mistral
  • Traitement intensif : Apache Spark, via les serveurs de calcul internes de Santé publique France

Nos dernières actualités

actualité

« Protéger la population des risques de l’alcool ». Le dossier de La Santé...

actualité

Appel à candidature pour compléter le Comité national des infections...

actualité

Semaine de la santé sexuelle 2026 : le dépistage et la prévention restent...