

Thèse 'Codage Neuronal Avancé pour les Signaux Audio Mono et Stéréo' H/F Orange
Lannion - 22 CDD- 🏠 Télétravail partiel
- 🕑 36 mois
- Bac +5
- Industrie high-tech • Telecom
- Exp. - 1 an
Les missions du poste
Votre rôle est d'effectuer un travail de thèse sur le sujet : " Codage neuronal avancé pour les signaux audio mono et stéréo ".
Contexte global et problématique du sujet
La compression audio (ou codage audio) est un domaine issu du codage de source, avec un long historique marqué par le développement de nombreux codecs (codeurs-décodeurs), dont certains sont très connus du grand public comme MP3 ou AAC pour la transmission ou le stockage de musique.
Depuis quelques années, le domaine du codage audio est révolutionné par les technologies de l'apprentissage profond (deep learning). Les réseaux de neurones artificiels permettant d'atteindre des débits de compression très faibles.
Ainsi, une nouvelle génération de méthodes de compression de signaux multimédia a émergé avec le deep learning. Les architectures de type autoencodeur s'appuyant sur un apprentissage antagoniste (GAN pour Generative Adversarial Network) donnent de très bons résultats, avec des codecs comme SoundStream, EnCodec, ou Descript Audio Codec (DAC). D'autres approches, telles que les modèles de diffusion, sont aussi étudiées.
Les codecs audio neuronaux actuels sont pour l'essentiel en mono. Comparés aux codecs " traditionnels ", ils sont en général bien plus complexes (en termes de ressources de calcul), requièrent un stockage très significatif (par exemple de l'ordre de 10 à 80M de paramètres).
Objectif scientifique - résultats et verrous à lever
Dans ce contexte, l'objectif de la thèse est de concevoir et développer des méthodes de codage audio innovantes basées sur le deep learning, pour les signaux mono et stéréo.
La thèse visera en particulier à lever les verrous scientifiques suivants :
Obtenir une représentation audio par réseaux de neurones (artificiels) qui soit capable de couvrir à la fois le mono et le stéréo
Réduire la complexité des modèles de représentation en codage audio neuronal
Obtenir un espace latent interprétable (donnant une séparation de type fréquentielle ou une séparation de contenus)
Il s'agira par exemple d'étudier les approches récentes comme les transformers ou les modèles de diffusion, et de tester et explorer de nouvelles architectures de réseaux de neurones.
Nos étapes de recrutement
Les étapes de recrutement peuvent varier selon l’offre à laquelle vous postulez.
-
Proposition d’entretien ou réponse négative dans les 15 jours après votre candidature
-
Entretien en visio ou présentiel avec le/la consultant(e) en recrutement sous 15 jours
-
Rencontre en visio ou présentiel avec le/la manager
-
Votre candidature est retenue, félicitations ! Vous recevez votre proposition d'embauche
-
Bienvenue chez Orange :) votre programme d’intégration démarre
-
En cas de réponse négative, nous restons à votre disposition pour un debrief
L'adresse du poste
Localisez l'entreprise et calculez votre temps de trajet en un clic !
Calculer mon temps de trajet
Le profil recherché
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
Bases solides en mathématiques (probabilités, algèbre...) et traitement numérique du signal
Appétence pour le traitement de parole/audio
Connaissances approfondies en Python - la connaissance du langage C et de MATLAB serait un plus
Expérience en apprentissage automatique, notamment réseaux de neurones profonds (deep learning), bonne pratique sur le framework PyTorch
Rigueur et créativité
Bonne maîtrise de l'anglais
Formation demandée : Master Recherche et/ou école d'ingénieur (avec un stage dans un laboratoire de recherche)
Références indicatives
1. Minje Kim and Jan Skoglund, "Neural Speech and Audio Coding, " arXiv :2408.06954v1, 2024
2. Thomas Muller, Stephane Ragot, Laetitia Gros, Pierrick Philippe, Pascal Scalart, Speech quality evaluation of neural audio codecs, Interspeech, 2024
3. N. Zeghidour et al., "SoundStream : An End-to-End Neural Audio Codec, " IEEE/ACM Trans. TASLP, 2021, arXiv :2107.03312
4. R. Kumar et al., "High-Fidelity Audio Compression with Improved RVQGAN, " in Advances in Neural Information Processing Systems, vol. 36, 2023.
5. J.D Parker et al., Scaling Transformers for Low-Bitrate High-Quality Speech Coding, arXiv :2411.19842, Nov. 2024
6. Yaoxun Xu, et al., " MuCodec : Ultra Low-Bitrate Music Codec, " arXiv :2409.13216, Sep. 2024
Raisons de nous rejoindre
-
Mutuelle et prévoyance collective
-
Un smartphone professionnel pour tous
-
Remise de 30% sur les abonnements perso internet et mobile Orange
-
Avec le CSE, pack culture, CESU, chèques-vacances, billetterie
-
Orange participe financièrement aux trajets domicile-travail
-
Jusqu'à 20 jours de RTT selon le régime de travail
-
Compte Epargne Temps
-
Plan d'Epargne Entreprise et Plan d'Epargne Retraite Collectif
-
Programme de sponsoring interne pour soutenir vos projets passion
-
Droit à la déconnexion numérique en dehors des heures de travail
Bienvenue chez Orange
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité...), les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.
Au sein de Innovation, vous serez intégré(e) dans une équipe à la pointe de l'innovation et de l'expertise sur le traitement du signal audio. La thèse porte sur la compression audio par réseau de neurones, qui est un champ de recherche très actif, avec de nombreuses pistes restant à explorer. Les résultats pourront être directement exploitables car la compression audio neuronale est déjà intégrée dans certains services.
Infos complémentaires
une couverture santé et prévoyance, des réductions sur les offres et produits d'Orange ainsi que les activités sociales et culturelles proposées par le comité d'entreprise.
Créez une alerte
Pour être informé rapidement des nouvelles offres, merci de préciser les critères :
Envoyez votre candidature
dès maintenant !
Créez votre compte et
envoyez votre candidature !
dès maintenant !
envoyez votre candidature !
Recherches similaires
- Job Saint-Brieuc
- Job Dinan
- Job Paimpol
- Job Guingamp
- Job Loudéac
- Job Perros-Guirec
- Job Rostrenen
- Job Plancoët
- Job Lamballe-Armor
- Job Callac
- Entreprises Lannion
- Job Débutant
- Job Public
- Job Espace
- Job Ressources
- Job Numérique
- Job Cdd Lannion
- Job Espace Lannion
- Job Public Lannion
- Job Anglais Lannion
- Job Demain Lannion
- Orange Lannion
{{title}}
{{message}}
{{linkLabel}}