Aller au contenu principal

Apprenti Data Scientist - Ingénieur en Traitement Automatique des Langues H/F Fonction publique Hospitalière

Paris - 75
Alternance
Salaire alternance -
Résumé de l'offre
  • 486,49 - 1 801,80 € / mois
  • Bac +3, Bac +4
  • Bac +5
  • Service public hospitalier

Détail du poste

Au sein de l'équipe data science, vous aurez pour mission de développer, valider et maintenir des algorithmes et bibliothèques logicielles scientifiques facilitant l'exploitation des données de l'entrepôt de données de santé. Vous vous concentrerez en particulier sur les outils de traitement automatique du langage permettant de transformer les données non structurées textuelles de l'EDS en données structurées directement exploitables. Vous vous appuierez pour cela sur les nombreux projets de recherche et de pilotage déjà engagés sur l'EDS avec qui vous consoliderez leur expression de besoins ainsi que sur les premiers développements réalisés par l'équipe science des données. Les développements que vous réaliserez seront diffusés au sein de la communauté de recherche de l'AP-HP afin d'être utilisés par les chercheurs pouvant en bénéficier.

Vos missions consisteront à développer et maintenir des bibliothèques scientifiques adaptées au contexte spécifique de l'EDS (en particulier les projets EDS-PDF). Vous pourrez être amené.e à contribuer à des articles scientifiques valorisant d'un point de vue académique ces différents travaux.

L'objectif principal de l'apprentissage est le développement d'une extension de la bibliothèque EDS-PDF. Cette bibliothèque vise à extraire le contenu textuel pertinent des comptes rendus médicaux stockés au format pdf. L'extension visera notamment à mieux intégrer les formulaires et les documents scannés. Des méthodes d'apprentissage profond (deep learning) et d'analyse de données massives (big data) devront être mobilisées pour mener à bien vos missions. Vous pourrez être amené.e à consolider un corpus d'entraînement et de validation. D'autres missions du périmètre de l'équipe pourront être confiées à l'apprentis en fonction de son avancement et de sa capacité à produire. Une attention particulière sera donnée à la qualité du code, au respect des bonnes pratiques collaboratives et à la capacité à communiquer sur les travaux réalisés.

Missions principales :
- Développement, validation et maintenance de bibliothèques logicielles scientifiques écrites en Python facilitant l'intégration et l'exploitation des données de l'EDS ;
- Développement de modèles de machine learning (ML) pour pré-traiter les données ;
- Rédaction des documentations (technique et utilisateur) ;
- Revue de littérature scientifique et présentation de travaux de l'état de l'art ;

Le profil recherché

Compétences :
- Vous êtes étudiant en machine learning et avez des connaissances avancées dans le domaine du développement de modèles de machine learning (Tensorflow, Pytorch etc.) en python ;
- Vous avez de l'expérience en analyse de bases de données (SQL), en calcul distribué et en data management (Spark, etc.) ;
- Vous avez une appétence forte pour le traitement automatiques des langues (NLP) ;
- Vous avez une appétence pour le domaine de la santé ;
- Vous avez une appétence pour le déploiement de modèles statistiques/de machine learning ;
- Vous êtes en capacité de lire la littérature scientifique ;

Prérequis :
- Master 1 (ou équivalent Bac +4) d'une formation délivrant un diplôme d'ingénieur ou de master en machine learning, intelligence artificielle, science des données et/ou traitement de données massives
- Expérience professionnelle dans le domaine des données de santé appréciée

Savoir-faire et savoir être :
- Esprit d'équipe et fort sens du relationnel
- Autonomie, rigueur, méthode
- Excellentes aptitudes relationnelles et à la communication, capacité d'écoute et de vulgarisation, capacité de formation (aisance à l'oral, diplomatie)
- Capacité de travail importante, associée à un fort dynamisme.
- Curiosité et capacité d'adaptation et d'anticipation
- Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé

Infos complémentaires

Non renseigné

Apprenti Data Scientist - Ingénieur en Traitement Automatique des Langues H/F
Fonction publique Hospitalière
  • Paris - 75
  • Alternance
Publiée le 05/04/2025 - Réf : APHP_2025-15577

Finalisez votre candidature

sur le site du partenaire

Créez votre compte pour postuler

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

Axa group operations recrutement
Paris - 75
Alternance
842 - 2 158 € / mois
Voir l’offre
il y a 24 jours
BPCE SEF recrutement
Paris - 75
Alternance
486,49 - 1 801,80 € / mois
🏡 Télétravail partiel
Voir l’offre
il y a 21 jours
Crédit Agricole d'Ile de France recrutement
Crédit Agricole d'Ile de France recrutement
Paris 12e - 75
Alternance
486,49 - 1 801,80 € / mois
Voir l’offre
il y a 29 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Application Android (nouvelle fenêtre) Application ios (nouvelle fenêtre)
Informations légales CGU Politique de confidentialité Gérer les traceurs Aide et contact
Nous suivre sur :