Intelligence Artificielle : démocratisation en vue, place à l'AI Engineering - partie 3

Auteurs :

Jérôme BESSON

Directeur

Contactez

6 minutes

Les entreprises qui ont expérimenté l’IA sont aujourd’hui à un point d’inflexion et s’interrogent sur comment franchir le cap de l’expérimentation. Nombre de projets tagués IA ne passent en effet pas en production alors que les technologies se démocratisent et les pratiques se répandent. Découvrez l'intérêt de mettre en place une plateforme d'intelligence d'entreprise pour créer durablement la confiance dans vos modèles, facteur indispensable pour le déploiement de l'IA à l'échelle de l'entreprise.

#Vers une plateforme d’entreprise dédiée

Alors que de nombreuses entreprises ont investi dans des plateformes data, que ces dernières se révèlent comme un atout précieux pour leur initiatives IA : catalogage des données d’entreprise, approvisionnement & rafraichissement en données d’entraînement (même si de nouvelles techniques d’« ice-breaking » permettent d’en limiter le besoin, voire de s’en passer), traçabilité des entrées/sorties des modèles au ‘run’, production des ‘KPIs Business’ de mesure de leur réelle valeur métier, il convient, dès lors que le nombre de modèles en production augmentent de mettre en œuvre une approche industrielle adossée à une plateforme d’intelligence artificielle d’entreprise dédiée, intégrée sans couture avec la plateforme data. Cette séparation des genres est fortement recommandée, voire essentielle pour l'entreprise "data & ai-driven". Data et modèles sont en effet des objets de nature totalement différentes, ayant des cycles de vie indépendants.

Ainsi, à l’instar de la plateforme DATA d'entreprise en charge de gérer de façon industrielle les ‘data pipelines’ de l’entreprise (collecte, stockage, préparation/traitement, mise à disposition), la plateforme IA d'entreprise (Data Science & Machine Learning) a la responsabilité de gérer les ‘model pipelines’ sur l’ensemble de la chaine de valeur : sélection des données, choix de l'algorithme, entraînement, généralisation, opérationnalisation, intégration, déploiement, supervision, exploitation et amélioration continue. Elle doit autoriser la diversité des pratiques et outillage ‘data science’ en perpétuel innovation. Elle doit permettre de supporter différents 'model pipelines' selon la sensibilité technique et métier du modèle. En effet, selon les modèles les opérations à réaliser pour les déployer en toute confiance en production ne sont pas nécessairement les mêmes. La robustesse fonctionnelle, la performance à l'exécution, la cible de déploiement et d'exécution attendues peuvent en effet varier d'un modèle à l'autre et nécessiter de fait plus où moins d'effort de professionnalisation et de contrôle.

La plateforme IA se doit également d'être ouverte et extensible en termes de solutions 'plugables' (Studio Data Science, bibliothèque de modèles, de détection de biais, gestionnaire de modèle…), de technologies (langages de développement, frameworks auto-ml...) et d’intégration à l’écosystème notamment data, 'api' et 'cloud’. Elle doit aussi être en mesure de transposer le cadre de gouvernance ‘data science’ de l’entreprise : organisation – rôles & responsabilités, processus & contrôles - vérification de l'adéquation des données d'entraînement, détection des biais, normes & standards d'implémentation, maitrise des coûts d'entrainement et prévisions des coûts d'exploitation, etc.

#Une glue industrielle à construire

Pour activer cette ‘Enterprise Intelligence Platform’, il est peu probable que l'entreprise se tourne vers des solutions 'on-premise', Editeurs et 'Open Source' tant le 'Cloud' a pris une avance sans doute décisive sur le sujet en terme d'efficacité et d'efficience.

Dans tous les cas l'effort pour disposer d'une chaîne IA industrielle ('ModelOps') ne sera pas neutre même en s'adossant d'emblée à un écosystème IA cloud. En effet, si les grands offreurs Cloud proposent des offres évoluées promettant la démocratisation de l'IA à grand coups d'"auto-ml", ces dernières restent aujourd'hui des offres 'légo' où lorsque intégrées offrent des capacités de paramétrage souvent insuffisantes pour coller au contexte et aux exigences de l'entreprise sur la façon dont elle souhaite construire la confiance sur ses modèles. Une confiance peut compatible avec les approches "boites noires" automatiques dès lors qu'une explicabilité forte est attendue ou des règles strictes sont à appliquer. Si ces plateforme "AI ready" permettent d'aller relativement vite pour opérationnaliser un modèle produit par un 'data scientist' au sein du même écosystème et de s'affranchir d'une partie de la complexité sous-jacente des technologies, elles sont en défaut dès lors que l'on veut le faire de façon répétée et automatisée. Et surtout, dès lors que l'on veut les surcharger pour y intégrer le modèle de gouvernance 'Data Science/AI' spécifique à l'entreprise. Une exigence pourtant non négociable. Une exigence qui impose d'y adjoindre une surcouche d'industrialisation paramétrable pour supporter les différents 'model pipelines' porteur du cadre de gouvernance.

Ce socle applicatif d'industrialisation qui encapsule les règles de gouvernance des modèles de l'entreprise en permet l'opérationnalisation, le déploiement et leur supervision en toute confiance. A la réception d'un modèle livré par un 'data scientist' et avant sa mise en production, il permet d'opérer toutes les opérations décidées par l'entreprise selon la sensibilité métier et technique de chaque modèle : vérification de sa reproductibilité, validation de sa généralisation, réalisation des contrôles sur la structure et qualité du code, test de sa scalabilité, etc. Il permet également d'y adjoindre des métriques techniques et fonctionnelles simplifiant au quotidien le suivi de son statut et facilitant le diagnostic en cas de problème à telle ou telle étape de son cycle de vie sans se perdre dans les méandres des consoles de supervision techniques et autre puits de logs des plateformes et outils. Il permet aussi le 'packaging' du modèle pour la ou les cibles d'exécution (containerisation, apisation...) et son déploiement selon différents modes pour supporter par exemple de l'"A/B testing", du 'switch' automatique de modèles si un modèle s'avère plus performant qu'un autre. Il permet enfin l'ajout de métrique métier pour mesurer son apport de valeur 'business' .

#Une gouvernance indispensable

La mise en place d'une plateforme d'intelligence d'entreprise va donc de pair avec la définition d'un cadre de gouvernance 'data science/AI'.

Pour déployer l’intelligence artificielle à l’échelle, l’entreprise doit définir ce cadre commun, l’expliciter, le diffuser et l’outiller pour s’assurer de son application. Ce cadre commun doit être construit progressivement pour en faciliter l’acceptation. Il doit préciser les critères d’éligibilité des cas d’usage à l’IA, définir les règles pour la construction des modèles, leur validation et leur exploitation. Il doit statuer sur les rôles et responsabilités des parties prenantes (’business product owner, business analyst, data scientist, ai engineer…’) au ‘Build’ et au ‘Run’. Il doit préciser les règles de propriété intellectuelle, d’usage de modèles pré-entrainés fournis par des tiers (‘Scoring, Recognition, Segmentation models…’) ou embarqués dans des progiciels (‘xRM, HR, Supply Chain…’).

Le cadre doit également garantir la reproductibilité et la traçabilité d’exécution, encadrer la bascule des modèles en production par exemple en imposant une phase systématique de déploiement sur un périmètre pilote avant généralisation où encore la capacité à neutraliser un modèle sans interruption de l’activité de l’entreprise.

Enfin et non des moindres, le cadre doit également inclure un volet gouvernance des données pour s’assurer de la validité des ‘data sets’ utilisées en matière de volume, de variété, de qualité, de conformité réglementaire, d’éthique, de droits d’usage et de responsabilité légale. La gouvernance des données est un élément critique d’efficacité du processus de construction des modèles.

Ne manquez pas la conclusion de cette série d'article mettant en évidence tout l'intérêt que devrait porter les entreprises à l'AI engineering et pas uniquement à la data science.

Découvrez la première partie sur pourquoi peu de modèles d'IA dépassent le stade de l'expérimentation.

Comprenez dans la deuxième partie les caractéristiques qui font qu'un modèle d'IA n'est pas un objet logiciel comme les autres.

Enfin lisez notre conclusion sur pourquoi l'AI engineering doit devenir une capacité clé de l'entreprise digitale aussi importante, si ce n'est plus que la data science.