Ingénieur / Ingénieure d'intégration applicative (H/F)

Postuler à cette offre
Partager

💼 Offre d'emploi

Date de publication
03/10/2025
Dernière mise à jour
03/10/2025
Type de contrat
CDD - 3 Mois
Durée de travail
00H/semaine Travail en journée
Expérience
Débutant accepté
Salaire
2571
Permis demandé
Aucune information

📍 Entreprise

Aucun logo fourni
Employeur
Non renseigné

Le Centre national de la recherche scientifique, plus connu sous son sigle CNRS, est un établissement public à caractère scientifique et technologique (EPST). Pour relever les grands défis présents et à venir, ses scientifiques explorent le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Internationalement reconnu pour l’excellence de ses travaux scientifiques, le CNRS est une référence aussi bien dans l’univers de la recherche et développement que pour le grand publ...

Lieu de travail

91 - Gif-sur-Yvette (Code postal 91190) Voir sur une carte

Description de l'offre

Mission :
Le projet porte sur l'étude des méthodes du traitement du langage naturel, et comment celles-ci peuvent bénéficier des approches dites d'atomisation du contexte.
L'atomisation consiste à reformuler une phrase ou un ensemble de phrases en une liste de propositions atomiques (c'est-à-dire des phrases qui sont à la fois concises et sémantiquement autonomes).
Cette méthode a déjà porté ses fruits dans les approches de générations augmentées par récupération, en vérification automatique de la factualité et en évaluation de résumé.
Les différentes expériences et évaluations porteront sur des corpus de la littérature du TAL en langue Française. En particulier sur un corpus créer au sein du laboratoire, le corpus de question-réponse CQUAE~\cite{DBLP:conf/coling/GeraldVETP24}. Pour l'évaluation, nous planifions d'évaluer l'apport de ces reformulations en propositions atomiques sur la génération de automatique de questions ou bien de réponses. Par exemple, on pourra imaginer fournir à la place du contexte les atomes au lieu du contexte original et en mesurer l'influence sur la qualité de la génération. Une deuxième question de recherche est la pertinence de ces approches pour la vérification d'information, la construction d'un graphe de connaissance à partir des atomes extraits est envisagée dans le but de vérifier la factualité des réponses.
Le candidat devra pendant la durée du contrat proposer de nouvelles méthodes pour l'atomisation de paragraphes textuels et/ou proposer de nouvelle métrique d'évaluation s'appuyant sur ces approches pour vérifier l'exactitude des générations produites par des modèles génératifs.

Activités :
Le candidat devra être en mesure d'intégrer ses connaissances dans les approches de vérification d'information pour l'explicabilité des réponses des modèles génératifs pour tenter de répondre à la question ``Les approches d'atomisation peuvent-elles améliorer les performances ou l'explicabilité des grands modèles de langue ?''. Parmi les objectifs permettant de répondre à cette question, plusieurs axes sont aujourd'hui retenus :
- Proposer des méthodes innovantes pour la création de propositions atomiques
- Évaluation de l'atomicité des propositions (en testant cette évaluation)
- Proposer de nouvelles métriques d'évaluation des modèles génératifs se basant sur l'exploitation des propositions atomiques
- Proposer un code facilement réutilisable, dans différents domaines du traitement du langage naturel.

Postuler à cette offre
Partager

Identifiant de cette offre d'emploi sur France Travail : 3208427

Libellé ROME de l'offre d'emploi : Cartographe (Code ROME : M1808)

Autre appellation de l'offre : Opérateur / Opératrice géographe

Offre d'emploi et contenus récupérés en partenariat avec France Travail. Cojob n'est pas responsable des informations fournies.

Offres d'emploi similaires