

Thèse -Compréhension Automatique de la Parole pour Langues Africaines H/F Orange
Lannion - 22 CDD- 🏠 Télétravail partiel
- 🕑 36 mois
- Bac +5
- Industrie high-tech • Telecom
- Exp. - 1 an
Les missions du poste
Votre rôle est d'effectuer un travail de thèse sur : Compréhension automatique de la parole multilingue pour les langues d'Afrique subsaharienne.
Contexte global : Orange est présent dans 14 pays en Afrique subsaharienne et souhaite mieux communiquer, mieux informer et améliorer l'accès à ses services pour les clients de cette zone. Seule une minorité maîtrise la lecture et l'écriture du français ou de l'anglais, écartant la majeure partie de la population africaine des technologies numériques et des facilités qu'elles apportent. L'accès par la voix est une solution, mais les technologies vocales sont développées en langues internationales, et non pas en langues africaines. Des stratégies doivent être mises en place pour trouver comment communiquer avec ses clients dans leurs langues.
Cette thèse s'attachera à éclairer ces stratégies, par des méthodes innovantes et disruptives d'apprentissage machine. La ou le candidat sélectionné.e développera des modèles de compréhension de la parole nécessaires au développement de technologies d'interaction vocale. Les approches " bout-en-bout " seront privilégiées. Toutefois, cette approche requiert un volume important de données annotées, non disponible pour les langues orales. Il sera donc nécessaire de trouver des méthodes pour pallier ce manque. Les données textuelles ne reflètent pas l'usage oral de la langue. Ainsi, baser l'apprentissage des modèles de parole sur des ressources écrites ou des lectures de textes peut mener à certaines problématiques, comme une mécompréhension de la requête de la part du système ou encore une évaluation biaisée des systèmes par les concepts sous-jacents de l'écriture. D'autre part, l'utilisation de corpus textuels entraîne la perte d'informations paralinguistiques et suprasegmentales présentes dans le support vocal. Enfin, l'alternance codique, fréquente dans ces langues, est également peu prise en compte dans les modèles actuels, en raison de faible présence dans les documents écrits. Ainsi, des stratégies visant à réduire au maximum la dépendance aux annotations seront mises en oeuvre pour surmonter le manque de données et renforcer la robustesse du système face aux variations linguistiques.
Objectif scientifique - résultats et verrous à lever
L'objectif de la thèse est de résoudre des tâches de compréhension de la parole, adaptées à la zone subsaharienne, en proposant des stratégies innovantes et différenciantes pour adresser le multilinguisme et la rareté des données.
Nos étapes de recrutement
Les étapes de recrutement peuvent varier selon l’offre à laquelle vous postulez.
-
Proposition d’entretien ou réponse négative dans les 15 jours après votre candidature
-
Entretien en visio ou présentiel avec le/la consultant(e) en recrutement sous 15 jours
-
Rencontre en visio ou présentiel avec le/la manager
-
Votre candidature est retenue, félicitations ! Vous recevez votre proposition d'embauche
-
Bienvenue chez Orange :) votre programme d’intégration démarre
-
En cas de réponse négative, nous restons à votre disposition pour un debrief
L'adresse du poste
Localisez l'entreprise et calculez votre temps de trajet en un clic !
Calculer mon temps de trajet
Le profil recherché
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
Compétences en traitement automatique du langage (compréhension automatique de la parole, reconnaissance automatique de la parole ou traitement automatique du langage)
Connaissances poussées en apprentissage profond (architectures, algorithmes et méthodes)
Maîtrise avancée du langage Python et des bibliothèques pour l'apprentissage profond (huggingface_hub, etc.)
Connaissances approfondies d'un framework de deep learning (Pytorch, Tensorflow2, Jax...)
Formation demandée
Master 2 en Traitement Automatique du Langage, Informatique, Sciences des données ou Mathématiques
Expériences souhaitées
Élaboration ou optimisation d'un système neuronal pour une tâche de compréhension du langage fortement apprécié
Connaissances en apprentissage auto-supervisé ou non supervisé appréciées
Connaissances approfondies d'un toolkit tel que SpeechBrain, ESPNet, NeMo appréciées
Connaissance des méthodes d'apprentissage frugal (distillation, quantization, PEFT...) est un plus
Connaissance des pipelines d'intégrations et de tests de Gitlab est un plus
Raisons de nous rejoindre
-
Mutuelle et prévoyance collective
-
Un smartphone professionnel pour tous
-
Remise de 30% sur les abonnements perso internet et mobile Orange
-
Avec le CSE, pack culture, CESU, chèques-vacances, billetterie
-
Orange participe financièrement aux trajets domicile-travail
-
Jusqu'à 20 jours de RTT selon le régime de travail
-
Compte Epargne Temps
-
Plan d'Epargne Entreprise et Plan d'Epargne Retraite Collectif
-
Programme de sponsoring interne pour soutenir vos projets passion
-
Droit à la déconnexion numérique en dehors des heures de travail
Bienvenue chez Orange
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité...), les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.
Au sein de Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l'innovation et de l'expertise sur le domaine des technologies vocales, de leur conception à leur mise en production. Vous ferez partie intégrante d'une équipe composée d'une vingtaine de chercheurs, doctorants et ingénieurs, spécialisés dans le domaine du traitement de la parole.
Infos complémentaires
une couverture santé et prévoyance, des réductions sur les offres et produits d'Orange ainsi que les activités sociales et culturelles proposées par le comité d'entreprise, restaurant d'entreprise
Créez une alerte
Pour être informé rapidement des nouvelles offres, merci de préciser les critères :
Envoyez votre candidature
dès maintenant !
Créez votre compte et
envoyez votre candidature !
dès maintenant !
envoyez votre candidature !
Recherches similaires
- Job Saint-Brieuc
- Job Dinan
- Job Paimpol
- Job Guingamp
- Job Loudéac
- Job Perros-Guirec
- Job Rostrenen
- Job Plancoët
- Job Lamballe-Armor
- Job Callac
- Entreprises Lannion
- Job Débutant
- Job Ressources
- Job Cybersecurite
- Job Anglais
- Job Scientifique
- Job Cdd Lannion
- Job Francais Lannion
- Job Anglais Lannion
- Job Demain Lannion
- Orange Lannion
{{title}}
{{message}}
{{linkLabel}}