Ingénieur / Ingénieure d'intégration applicative (H/F)
💼 Offre d'emploi
- Date de publication
- 03/10/2025
- Dernière mise à jour
- 03/10/2025
- Type de contrat
- CDD - 3 Mois
- Durée de travail
- 00H/semaine Travail en journée
- Expérience
- Débutant accepté
- Salaire
- 2571
- Permis demandé
- Aucune information
📍 Entreprise
- Employeur
- Non renseigné
Le Centre national de la recherche scientifique, plus connu sous son sigle CNRS, est un établissement public à caractère scientifique et technologique (EPST). Pour relever les grands défis présents et à venir, ses scientifiques explorent le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Internationalement reconnu pour l’excellence de ses travaux scientifiques, le CNRS est une référence aussi bien dans l’univers de la recherche et développement que pour le grand publ...
Lieu de travail
91 - Gif-sur-Yvette (Code postal 91190) Voir sur une carte
Description de l'offre
Mission :
Le projet porte sur l'étude des méthodes du traitement du langage naturel, et comment celles-ci peuvent bénéficier des approches dites d'atomisation du contexte.
L'atomisation consiste à reformuler une phrase ou un ensemble de phrases en une liste de propositions atomiques (c'est-à-dire des phrases qui sont à la fois concises et sémantiquement autonomes).
Cette méthode a déjà porté ses fruits dans les approches de générations augmentées par récupération, en vérification automatique de la factualité et en évaluation de résumé.
Les différentes expériences et évaluations porteront sur des corpus de la littérature du TAL en langue Française. En particulier sur un corpus créer au sein du laboratoire, le corpus de question-réponse CQUAE~\cite{DBLP:conf/coling/GeraldVETP24}. Pour l'évaluation, nous planifions d'évaluer l'apport de ces reformulations en propositions atomiques sur la génération de automatique de questions ou bien de réponses. Par exemple, on pourra imaginer fournir à la place du contexte les atomes au lieu du contexte original et en mesurer l'influence sur la qualité de la génération. Une deuxième question de recherche est la pertinence de ces approches pour la vérification d'information, la construction d'un graphe de connaissance à partir des atomes extraits est envisagée dans le but de vérifier la factualité des réponses.
Le candidat devra pendant la durée du contrat proposer de nouvelles méthodes pour l'atomisation de paragraphes textuels et/ou proposer de nouvelle métrique d'évaluation s'appuyant sur ces approches pour vérifier l'exactitude des générations produites par des modèles génératifs.
Activités :
Le candidat devra être en mesure d'intégrer ses connaissances dans les approches de vérification d'information pour l'explicabilité des réponses des modèles génératifs pour tenter de répondre à la question ``Les approches d'atomisation peuvent-elles améliorer les performances ou l'explicabilité des grands modèles de langue ?''. Parmi les objectifs permettant de répondre à cette question, plusieurs axes sont aujourd'hui retenus :
- Proposer des méthodes innovantes pour la création de propositions atomiques
- Évaluation de l'atomicité des propositions (en testant cette évaluation)
- Proposer de nouvelles métriques d'évaluation des modèles génératifs se basant sur l'exploitation des propositions atomiques
- Proposer un code facilement réutilisable, dans différents domaines du traitement du langage naturel.
Identifiant de cette offre d'emploi sur France Travail : 3208427
Libellé ROME de l'offre d'emploi : Cartographe (Code ROME : M1808)
Autre appellation de l'offre : Opérateur / Opératrice géographe
Offre d'emploi et contenus récupérés en partenariat avec France Travail. Cojob n'est pas responsable des informations fournies.