Big Data & I.A.

Diviser par 50 les coûts de traduction de millions de fiches produits grâce à l’IA générative : on l’a fait !

Conférence - 45min IntermédiaireFrançais

Traduire automatiquement des millions de fiches produits dans plus de dix langues pose des défis majeurs : coût, qualité linguistique, cohérence terminologique et robustesse en production. Ce retour d’expérience présente la conception et l’industrialisation d’un pipeline de traduction fondé sur des LLM, avec des gains mesurables en qualité et en efficacité dans un contexte industriel à grande échelle.

Les solutions de traduction SaaS traditionnelles sont coûteuses à grande échelle et offrent peu de possibilités de contextualisation et de personnalisation. Pour y remédier, nous avons expérimenté plusieurs stratégies fondées sur l’usage de modèles de langage (LLM).

  • Nous avons mis en place une évaluation automatisée via un second LLM juge, évitant ainsi l’annotation humaine tout en garantissant un suivi rigoureux de la qualité.
  • Un benchmark de modèles propriétaires et open source a permis une analyse croisée coût/qualité/latence, guidant nos choix technologiques selon les contraintes opérationnelles et budgétaires.
  • Pour aller plus loin, nous avons réalisé un fine-tuning de modèles open source, en tirant parti de nos données internes et de notre infrastructure on-premise, avec un fort accent sur la souveraineté, la sobriété et la réduction des coûts.

Fruit d’une collaboration étroite entre les équipes IT, Produit et Data Science, ce projet a permis de diviser par 50 les coûts de traduction sans dégrader la qualité.

P F

Pietro Fodra

Fort de huit années d’expérience au sein de Cdiscount et de ses filiales, j’ai occupé divers postes stratégiques dans des domaines variés : Data Science (acquisition digitale et scoring de crédit), Produit (catalogue produit), puis Direction Trafic (acquisition & SEO).

Je suis actuellement Directeur de la Transformation en IA Générative au sein du pôle Data Science de Peaksys, avec pour mission de déployer cette technologie innovante à l’échelle de notre groupe CNOVA.

Mathématicien de formation, j’ai obtenu un doctorat en mathématiques appliquées aux marchés financiers, avec une spécialisation en trading à haute fréquence, à l’Université Paris VII Diderot. J’ai également exercé plusieurs années dans le domaine de la finance quantitative.

LinkedIn : https://www.linkedin.com/in/pfodraphd/