Aller au contenu

Doctorant ou doctorante : « Soutenabilité et explicabilité par l’apprentissage sur de grands graphes de connaissances » – CDD de 36 mois

Sur site
  • Saint-Etienne, Auvergne-Rhône-Alpes, France
Informatique

Description de l'offre d'emploi

ENGLISH VERSION

Environnement du poste :

L’Institut Mines-Télécom est le 1er groupe public de Grandes Écoles d’ingénieur.e.s et de management de France. Constitué de huit Grandes Écoles publiques et de deux écoles filiales, l’Institut Mines-Télécom anime et développe un riche écosystème d’écoles partenaires, de partenaires économiques, académiques et institutionnels, acteurs de la formation, de la recherche et du développement économique.

Mines Saint-Étienne, Ecole de l'Institut Mines-Télécom, est chargée de missions de formation, recherche, innovation, transfert industriel et culture scientifique. Avec 2 500 élèves, 500 personnels, et un budget de 50 M€, elle rayonne sur 3 campus dédiés à l’industrie des futurs, à la santé et au bien-être et à la souveraineté numérique et microélectronique. Elle est classée dans le top 15 des Ecoles d’ingénieurs Françaises et dans le Top 500 des Universités mondiales.

La stratégie 2023-2027 de Mines Saint-Etienne s’inscrit dans celle de l’Institut Mines Telecom. Elle a pour ambition :

  • d’accompagner les transitions écologique, numérique, et générationnelle et d’en former les acteurs,
  • de soutenir la souveraineté nationale et européenne en microélectronique et numérique.

C’est dans cet objectif que l’Institut Fayol et le département Informatique et systèmes intelligents (ISI) et le Laboratoire d’informatique, de modélisation et d’optimisation des systèmes (LIMOS, UMR 6158) recrutent un·e doctorant·e en représentation des connaissances et apprentissage statistique, pour des travaux à l’intersection entre numérique, souveraineté et développement durable.

La thèse vise à trouver des alternatives aux grands modèles de langages (LLM), caractérisés par un grand nombre de paramètres et/ou un grand nombre de symboles dans leur corpus d’apprentissage. L’utilisation des LLM est synonyme d’une dépense énergétique considérable, dans leur phase d’apprentissage comme dans leur phase d’utilisation (inférence), et d’un manque de transparence sur le texte produit. L’objectif de la thèse sera de montrer que les graphes de connaissances tels que DBpedia, BabelNet ou ConceptNet peuvent être une solution à ces deux problèmes. Ils sont déjà largement utilisés pour des tâches de question-réponse, malgré une incomplétude notoire sur la modélisation physique (le raisonnement spatio-temporel, entre autres). L’incomplétude d’un grand graphe de connaissances peut être compensée par l’apprentissage de représentations vectorielles des principaux concepts du graphe (son ontologie fondationnelle), dont les propriétés géométriques restent interprétables sémantiquement.


Pré-requis du poste


Missions principales :

L’objectif du doctorat seront de développer une méthode pour l’apprentissage à moindre coût d’une représentation vectorielle de concepts et de produire un modèle de langage pré-entraîné à partir de DBpedia (ou graphe de connaissances similaire). Le modèle pré-entraîné pourra être utilisé pour du raisonnement spatio-temporel dans une application liée aux systèmes cyber-physiques.

Activités principales :

Le travail de recherche sera mené à travers des activités de recherche bibliographique, de mise en place d’expérimentations (en centre de calcul), de rédaction et de présentation de résultats. Durant la thèse, le candidat ou la candidate sera amené·e à manipuler de larges volumes de données, à utiliser des ressources de calcul CPU/GPU et à utiliser des bibliothèques de calcul vectoriel comme PyTorch. Il ou elle pourra aussi être amené·e à utiliser des méthodes d’analyse de cycle de vie pour mesurer l’impact environnemental d’un calcul.

D’autres activités d’animation de séminaires doctoraux, d’aide à l’organisation d’écoles d’été pourront être menées. La participation aux événements scientifiques du centre rentre dans les activités du ou de la doctorant·e.

Profil :

Connaissances, savoirs :

  • Diplôme de niveau Bac+5 dans les domaines de l’informatique, des sciences des données ou des mathématiques appliquées
  • Connaissances en :
  1. apprentissage statistique et/ou traitement automatique de la langue
  2. logique formelle et/ou Web sémantique
  3. (grandes) bases de données et/ou bases de données en graphe

Savoir-faire :

  • Maîtriser les techniques d’expression écrite et orale (rédaction de rapports ou de documents de synthèse, restitutions orales...)
  • Trouver un équilibre entre considérations théoriques (mathématiques) et mise en œuvre pratique d’expérimentations

Savoir-être :

  • Autonomie et sens de l’initiative
  • Curiosité intellectuelle et proactivité envers la technique (identification de problèmes, recherche de solutions, documentation personnelle, ...)

POURQUOI NOUS REJOINDRE :

L’Institut Mines-Telecom se caractérise par :
https://www.youtube.com/watch?v=m39m6hdNC48

  • Un environnement scientifique d’excellence,
  • Un groupe présentant des entités sur l’ensemble du territoire français.

Mines Saint-Etienne se distingue par :

  • Un environnement de travail privilégié avec un taux d'encadrement des étudiants et un taux d’environnement (fonctions support et soutien) élevé,
  • Des moyens expérimentaux et numériques de premier plan,
  • Une activité de recherche contractuelle importante (11 M€ / an de contrats en Recherche et Innovation), majoritairement avec des partenaires industriels,
  • 25% d’étudiants internationaux, Membre du réseau T.I.M.E. et de l'Université Européenne EULIST,
  • Un centre de Culture Scientifique Technique et Industrielle – La Rotonde - unique en France, qui démultiplie son impact sur la société (> 50 000 visiteurs par an),
  • Cadre de vie agréable : proximité du parc naturel du Pilat, faible coût de la vie, troisième métropole en région Auvergne-Rhône-Alpes et ville créative UNESCO
  • Frais de transports en commun pris en charge à hauteur de 75% (sous conditions),
  • Forfait mobilité durable,
  • Foyer du personnel (activités sportives, culturelles, avantages CE sur des loisirs et temps de convivialité),
  • Possibilité de télétravail partiel,
  • 49 jours de congés et RTT.

Conditions de recrutement :

  • CDD de droit public de 36 mois
  • Prise de fonction souhaitée : 1er octobre 2024
  • La rémunération sera fixée selon le profil du candidat, en fonction des règles définies par le cadre de gestion de l’Institut Mines Télécom
  • Temps plein
  • Poste basé à Saint-Étienne

Le poste est ouvert à toutes et tous avec, sur demande, des aménagements pour les candidates et candidats en situation de handicap.

Modalités de candidature :

Les dossiers de candidature (CV, lettre de motivation, lettre de recommandation le cas échéant) sont à déposer sur la plateforme RECRUITEE au plus tard le 5 mai 2024 :

https://institutminestelecom.recruitee.com/o/doctorant-ou-doctorante-soutenabilite-et-explicabilite-par-lapprentissage-sur-de-grands-graphes-de-connaissances-cdd-de-36-mois-2

Dans le cadre de sa politique Égalité, Diversité et Inclusion, l’École des Mines de Saint Etienne est un employeur soucieux de l’équité de traitement entre les candidatures.

Pour en savoir plus :

Pour tous renseignements sur le poste, s’adresser à :

Co-encadrant de thèse, Victor Charpenay, victor.charpenay@emse.fr

Directeur du département Informatique et systèmes intelligents et directeur de thèse, Antoine Zimmermann, antoine.zimmermann@emse.fr

Pour tout renseignement administratif, s’adresser à :

Julie Jaffre, julie.jaffre@emse.fr, 04 77 42 00 17

Information des candidats sur le traitement des données personnelles :

https://www.mines-stetienne.fr/wp-content/uploads/2018/12/Informations-des-candidats-sur-les-traitements-de-donn%C3%A9es-personnelles.pdf


ou