Rôle & seniorité: QA IA (niveau intermédiaire à senior) chargé de la qualité, fiabilité, robustesse et conformité des systèmes IA avant/dans/après production.

Stack / outils

QA: PyTest, Robot Framework
MLOps: MLflow, EvidentlyAI, Bento, Vertex AI
Tests GenAI/RAG/Agents: LangChain, LlamaIndex
Monitoring/explicabilité: WhyLabs, Arize AI, SHAP, LIME
Tests LLM: DeepEval, Ragas, Promptfoo
Versioning: DVC, Git; API: FastAPI/Flask (lecture)
CI/CD & data: pipelines ML, Data Versioning
Cadre conformité: CT-AI, RGPD, DPO interaction

Top 3 responsabilités

Définir la stratégie et les plans de test IA (data, modèle, risque, comportement) et assurer la couverture en accord avec PO et Data Scientists.
Réaliser et coordonner les tests multiveuillez (data quality, biais, drift, performance, robustesse, sécurité; tests GenAI/RAG/agents; end-to-end et UX).
Garantir conformité et traçabilité (registre IA, rapports d’audit, conformité RGPD, garde-fous métier).

Must-have skills

connaissance avancée de ML/LLM/RAG, pipelines, monitoring, métriques IA
culture MLOps (CI/CD, MLflow, data versioning)
conception de scénarios multi-couches et automatisation des tests
notions SRE, performance testing, CT-AI
rigueur scientifique, analyse critique, communication claire, sensibilité RGPD

Nice-to-haves

expérience en tests de sécurité (prompt injection, jailbreaking)
protocoles d’explicabilité (LIME/SHAP) et tests de ha

Full Description

Skapa est une des premières agences en France à exploiter les méthodes du Design Thinking et à les adapter à chaque organisation. Skapa facilite la transformation des organisations, à travers la conception collaborative de nouveaux modèles économiques tournés vers les services. Skapa ancre une dynamique positive de transformation des méthodes de travail et insuffle auprès des équipes qu’elle accompagne, une organisation plus agile, créative, fédératrice, transverse et communicante. Skapa impacte vos offres, crée de nouvelles solutions opérationnelles adaptées à vos clients cibles, vos stratégies, vos ressources. Skapa exploite ses compétences d’innovation et son esprit de challenge pour innover et concevoir vos solutions digitales, vos labs, vos sièges sociaux, vos objets connectés. Skapa stimule l’adhésion de toute l’organisation autour des solutions innovante crées et prépare ainsi un contexte positif à leur éclosion en interne et sur le marché. Skapa accompagne votre politique d’innovation, de transformation stratégique et réintègre vos clients dans la construction de vos enjeux d’avenir, dans le financement de vos innovations. Skapa conçoit une véritable expérience collaborateurs/client et réalise des solutions produit et digitale.

🎯 Rôle et mission générale

Le QA IA est responsable de la qualité, de la fiabilité, de la robustesse et de la conformité des systèmes IA avant, pendant et après la mise en production.

Il conçoit et exécute les tests multi-couches

Data testing Model testing System testing Tests spécifiques GenAI / RAG / Agents Tests de sécurité, biais, dérive et conformité (CT-AI)

Ce rôle devient crucial avec la montée des systèmes GenAI, agentiques et RAG.

🧩 Responsabilités clés

Stratégie de test IA

Définir la méthodologie QA adaptée au type de modèle: ML, LLM, RAG, agents.

Construire les plans de test IA: data tests, model tests, risk tests, behavior tests. Définir la couverture de test en accord avec le PO et les Data Scientists. Tests Data & Features Vérifier la qualité, cohérence, fraîcheur, représentativité des données. Détecter les biais potentiels. Définir des tests de drift data. Tests Modèle Tester la performance (metrics ML), la robustesse, l’explicabilité. Tester la stabilité selon différents jeux de données. Tester la sensibilité du modèle aux perturbations (adversarial tests). Tests systèmes IA Tests end-to-end (réception → prédiction → action → logs). Tests UX pour les assistants IA / agents. Tests de charge, latence, disponibilité, escalade. Tests spécifiques GenAI / RAG / Agents Détection et mesure des hallucinations. Tests de pertinence des sources RAG (grounding testing). Tests multi-agents (cohérence, coordination, divergence). Vérification du respect des garde-fous (ton, contraintes métier, RGPD). Documentation & conformité Contribution au dossier d’évaluation IA (CT-AI). Collaboration avec DPO sur les risques et RGPD. Mise à jour des registres IA et des reports d’audit.

QA IA (Quality Assurance IA / AI Test Engineer)