Data Scientist Llm Rag - Stage H/F

Les missions du poste

Le Groupe AXA est un leader mondial de l'assurance et de la gestion d'actifs, avec 160 000 collaborateurs au service de 105 millions de clients dans 62 pays.
Nous protégeons et conseillons nos clients à chaque étape de leur vie, en proposant des produits et services qui répondent à leurs besoins dans les domaines de l'assurance, de la prévoyance, de l'épargne et de la gestion des actifs.
Notre mission : Donner à chacun les moyens de vivre une vie meilleure.
Nos valeurs : Customer first, Intégrité, Courage et One AXA

AXA Partners est une BU transversale d'AXA qui propose une large gamme de solutions en matière de services d'assistance, d'assurance voyage et de couverture de crédit.

Le rôle d'AXA Partners est aussi de mettre en oeuvre des solutions innovantes issues de l'unité AXA Innovation.

Conjuguant passion et expertises de pointe, nous concevons et déployons des solutions à l'échelle mondiale pour nos partenaires, leurs clients et leurs collaborateurs, pour protéger ce qui compte dans les moments importants.
AXA Partners recherche un Data Scientist LLM RAG H/F pour un stage de 6 mois à partir du mois d'Avril 2025 !

Nous avons construit en 2024 un outil RAG générique (=Retrieval Augmented Generation) visant à alimenter les tout derniers modèles LLM de milliers de PDF, PowerPoint, Excel permettant d'apporter une réponse spécifique à nos données AXA tout en bénéficiant de la puissance de la GenAI.

Les applications sont nombreuses et variées :
- Permettre à nos clients de poser leurs questions sur les Terms&Conditions et obtenir une réponse précise et rapide sans avoir à lire les 80+ pages de PDF.
- Permettre à nos agents de consulter rapidement les manuels opérationnels d'assistance/dépannage pour fournir une réponse technique sans maîtriser parfaitement un domaine d'expertise précis.
- Permettre aux collaborateurs AXA de poser leurs questions sur les processus internes de l'entreprise (intranet, paie, congés etc.) etc.

La diversité de nos partenaires (Porsche, AMEX etc.) et de nos lignes de métiers (Motor, Home, Travel, Health) complexifie notre outil RAG et nous oblige à adopter l'approche la plus générique possible afin d'être capable de s'adapter à la particularité de chacun.

C'est pourquoi nous avons mis en parallèle plusieurs techniques à tous les niveaux :

Document parsing (PyMuPDF, Azure Doc Intelligence etc.

Document chunking (Recursive, LLM-based etc.)

Embeddings models (ada002, 003 etc.)

Retrieval (Hybrid search, Reranking, GraphRAG etc.)

Generative LLM models (GPT, Mistral, Llama etc.)

Missions principales

A partir de l'architecture existante et de centaines d'exemples de PDF provenant d'un use case prioritaire 2025, vous aurez pour mission de tester une nouvelle approche permettant d'améliorer l'accuracy du RAG et de l'intégrer dans l'architecture globale du RAG générique.

Ce stage se déroulera dans le cadre d'une approche Agile et sera l'occasion de :
- Travailler dans un environnement de développement collaboratif (Azure DEVOPS, branching, Pull Request)
- Découvrir de l'intérieur un acteur majeur d'assistance & assurance
- Mettre en pratique sur des problématiques concrètes et aux enjeux majeurs les techniques du Machine Learning
- Développer une capacité d'analyse et de réponse technique face à des problématiques concrètes en collaboration avec les acteurs métiers.
Profil recherché

Etudiant(e) en dernière année d'école d'ingénieurs ou en Master 2 Statistiques/Data Science.
- Traditionnal Machine learning (LightGBM/Random Forest, RNN, Transformer) : excellente maîtrise.
- LLM & GenAI : excellente maîtrise.
- Programmation : packages & frameworks (HuggingFace, Pandas, Scikit-learn, Tensorflow, Pytorch,) : excellente maîtrise.
- Théorie mathématique : bonne maîtrise
- Participation à des projets open-source, des compétitions Kaggle ou des meet-up de data science est un plus.

Compétences spécifiques attendues (informatiques, langues) :
- Anglais (écrit / lu / parlé) - niveau C1

Informations complémentaires

Vous savez faire preuve des qualités suivantes :
- Autonomie (2-3 jours de télétravail/semaine)
- Proactivité (métier non sensibilisé au Machine Learning la plupart du temps, il faut être force de proposition)
- Rigueur mathématiques, esprit analytique et de synthèse
- Capacité à travailler en équipe
- Communication : à la fois technique avec le tuteur, mais surtout savoir vulgariser son travail

AXA Partners s'engage, à compétences égales, pour la diversité & l'inclusion.

Rejoignez une entreprise qui contribue à la protection des forêts ! Chez AXA Partners, nous plantons un arbre pour chaque nouvelle recrue (en CDI) (Pour en savoir plus sur le programme Reforest, cliquez ici)

#LI-FR

Le profil recherché

Profil recherché

Etudiant(e) en dernière année d'école d'ingénieurs ou en Master 2 Statistiques/Data Science.
- Traditionnal Machine learning (LightGBM/Random Forest, RNN, Transformer) : excellente maîtrise.
- LLM & GenAI : excellente maîtrise.
- Programmation : packages & frameworks (HuggingFace, Pandas, Scikit-learn, Tensorflow, Pytorch,) : excellente maîtrise.
- Théorie mathématique : bonne maîtrise
- Participation à des projets open-source, des compétitions Kaggle ou des meet-up de data science est un plus.

Compétences spécifiques attendues (informatiques, langues) :
- Anglais (écrit / lu / parlé) - niveau C1

Informations complémentaires

Vous savez faire preuve des qualités suivantes :
- Autonomie (2-3 jours de télétravail/semaine)
- Proactivité (métier non sensibilisé au Machine Learning la plupart du temps, il faut être force de proposition)
- Rigueur mathématiques, esprit analytique et de synthèse
- Capacité à travailler en équipe
- Communication : à la fois technique avec le tuteur, mais surtout savoir vulgariser son travail

AXA Partners s'engage, à compétences égales, pour la diversité & l'inclusion.

Rejoignez une entreprise qui contribue à la protection des forêts ! Chez AXA Partners, nous plantons un arbre pour chaque nouvelle recrue (en CDI) (Pour en savoir plus sur le programme Reforest, cliquez ici)

#LI-FR

Lieu : Malakoff
Contrat : Stage
Télétravail : Télétravail partiel
Salaire : 1 868 € par mois
Accueil / Emploi / Emploi Malakoff / Emploi Data Scientist