Société Générale Assurances
Postée il y a 11 heures
Vos missions au quotidien
Société Générale Assurances, compagnie d'assurance du Groupe Société Générale, recherche un stagiaire Data Scientist pour travailler au sein du pôle IA du DataLab. Cette direction (13 personnes) réalise des études statistiques à haute valeur ajoutée auprès d’interlocuteurs variés (autres directions, filiales, distributeurs…). La direction développe également des solutions d’Intelligence Artificielle ayant pour but d’améliorer la connaissance client et l’efficacité opérationnelle des services de gestion de l’entreprise.
Quelques exemples de missions réalisées :
1) Construction et déploiement de solutions d’IA (NLP, IA Générative, Computer vision et Speech Analytics) pour optimiser les processus dans différents services de gestion : analyse automatique des verbatims clients, catégorisation automatique d’emails, extraction d’informations depuis des documents scannés, analyse du contenu audio des appels téléphoniques, ...)
2) Travaux R&D : transparence des algorithmes d’IA, application des LLM, travaux avec l’actuariat autour de l’utilisation de nouvelles données pour la tarification (analyse des données télématiques, données météo, modélisation de la probabilité de retard des vols, ...)
Le stage sera centré sur l'exploration et l'application des concepts avancés de graph-RAG (Retrieval Augmented Generation) pour enrichir les capacités de traitement de données complexes au sein de Société Générale Assurances. Vous serez amené à développer des solutions innovantes utilisant des graphes de connaissances pour améliorer le question-answering, en intégrant des données structurées et non structurées issues de diverses sources. L'objectif est de concevoir des modèles qui exploitent l'interconnexion des informations pour fournir des réponses précises et contextualisées aux questions sur les produits et processus opérationnels. Vous travaillerez également sur l'amélioration des performances des modèles en utilisant des techniques de fine-tuning et d'optimisation de l'inférence. Le stage vous offrira l'opportunité de participer à la mise en œuvre de ces modèles en production, en collaboration avec l'équipe de Data Scientists, tout en utilisant des frameworks et technologies de pointe dans le domaine des graphes et de l'IA Générative.
Et si c’était vous ?
Etudiant en 2ième ou 3ième année d’école d’ingénieur ou d’une formation orientée data science / software engineering, vous connaissez le cycle de vie d’un projet data science et avez une forte appétence pour le développement d’algorithmes de type NLP ou IA Générative à l’Etat de l’art. Afin de déployer en production (API, batch) les modèles développés, une connaissance des « bonnes pratiques » du développement software (écriture de code modulaire et documenté, bonnes pratiques de collaboration et de versioning, tests unitaires, documentation).
Stack logicielle utilisée
- Requis (un des deux a minima) : Python et leurs librairies ML standards (xgboost, scikit-learn, Tensorflow, Transformers,
- Sont un plus : MLflow, Kedro, CI/CD Gitlab
Informations générales
Poste à pourvoir en stage pour une durée de 4 à 6 mois, basé à Paris La Défense (92). Le début du stage est fixé à Mai 2025.