Data engineer
Offre publiée le 30/05/2025
💼 Offre d'emploi
- Type de contrat
- CDI
- Durée de travail
- 35H Travail en journée (35H Travail en journée)
- Expérience
- 36 Mois
- Salaire
- Annuel de 36000.0 Euros à 39000.0 Euros sur 12.0 mois
- Permis demandé
- Aucune information
📍 Entreprise
- Employeur
- CENTRE ANTOINE LACASSAGNE
- Secteur d'activité
- Activités hospitalières (Code NAF 86.10Z)
Lieu de travail
06 - NICE (Code postal 06100) Voir sur une carte
Compétences nécessaires
- Analyser, exploiter, structurer des données Exigé
- Concevoir et gérer un projet Exigé
- Enrichir une base de données Exigé
Description de l'offre
Les missions qui vous attendent
Au sein du Département d'Epidemiologie, de Biostatistique et des Données de Santé, en tant que Data engineer, vous aurez la responsabilité de créer les pipelines de flux de données (structurées et non structurées) vers l'entrepot de données de santé en construction au Centre Antoine Lacassagne. Vous aurez d'étroites relations avec les équipes de data management, data science et informatique (infrastructure, sécurité et opérationnelle).
Vos principaux objectifs sont de développer, maintenir et améliorer les solutions et infrastructures data nécessaires à la collecte, la centralisation, le stockage et l'accès aux données de santé collectées au sein du Centre Antoine Lacassagne (CAL).
Vous travaillerez majoritairement sur des données de santé de vie réelle. Ces données sont générées à l'occasion des soins réalisés en routine pour un patient au sein du CAL. Ces données peuvent provenir de multiples sources : dossier patient informatisé (DPI), logiciels de prise en charge (pharmacie, imagerie, anatomopathologie, oncopharmacologie, chirurgie, oncologie), informations utilisées pour le remboursement de soins, collecte spécifique permettant de créer des registres ou des cohortes ou des Entrepôts de Données de Santé (EDS), réseaux sociaux, objets connectés, etc.
Missions principales :
-Concevoir efficacement et maintenir des flux d'intégration (collecte, Ingestion, Stockage) permettant de centraliser les données issues de plusieurs sources dans un entrepôt de données de santé tout en garantissant une qualité de données.
-Mettre en place des pipelines de données sécurisées qui seront traitées et nettoyées par les data managers pour délivrer des bases « gelées » mises à disposition des experts scientifiques, biostatisticiens et data scientists.
-Concevoir et mettre en œuvre un process et un data pipeline permettant de valider la qualité des données intégrées automatiquement dans l'Entrepôt de données de Santé, par confrontation avec les données intégrées à partir de collecte manuelle.
-Assister les data scientists spécialistes de la structuration de données non structurées issues de compte-rendu médicaux ou fiche RCP (Réunion de Concertation Pluridisciplinaire) ou documents du DPI, avec des solutions de type Natural Language Processing (NLP).
-Rédiger et mettre à disposition la documentation (guide de procédure, documents utilisateurs, référentiels, .) et participer au dépôt du dossier de l'EDS
-Communication/collaboration avec les pilotes des différents projets : reporting auprès des managers hiérarchiques et de la direction
Quel est le profil idéal ?
-Connaissances de SQL, Python (Pandas, Numpy, .), PL/SQL (option)
-Bases relationnelles
-Connaissances des données médicales
-Bonne compréhension du cycle de vie de la donnée et de la data privacy
-Capacité à réconcilier de nombreuses sources de données hétérogènes
-Notions en FHIR serait un plus
-Notions en OMOP serait un plus
-Notions en OSIRIS RWD serait un plus
Débutant (moins de 2 ans), Expérimenté (2 à 5 ans), Confirmé (5 ans et plus)
Diplôme d'ingénieur Date engineer/data/informatique ou équivalent (Bac+5 minimum)
Identifiant de cette offre d'emploi sur France Travail : 193DXDQ
Libellé ROME de l'offre d'emploi : Data engineer (Code ROME : M1811)
Autre appellation de l'offre : Data engineer
Offre d'emploi et contenus récupérés en partenariat avec France Travail. Cojob n'est pas responsable des informations fournies.