smart solutions for smarter enterprises

Quel futur pour la Gestion Electronique de Document ?

Par Eric Phillipon, architecte solution chez Sentelis. Avec la collaboration de Jérôme Besson.

Une évolution profonde du besoin

Avec l’accélération de la dématérialisation des processus, la pression de plus en plus forte du législateur (e.g. KYC, GDPR) -devoir de conservation et autre droit à l’oubli-, le volume des documents électroniques à gérer par l’entreprise explose, leur variété croit et corrélativement les besoins d’ingestion, de stockage, de reconnaissance, de contrôle, d’archivage légal à valeur probante, de recherche ainsi que l’accès direct par les utilisateurs concernés s’étendent considérablement.

Les systèmes actuels de type EDM (Electronic Document Management) / DAM (Digital Asset Management) / ECM (Enterprise Content Management) ne sont pas forcément calibrés pour cela. Il leur faut gagner en flexibilité, modularité, performance et fonctionnalités pour répondre à ces nouvelles exigences opérationnelles et réglementaires.

Les technologies big data maintenant implantées en entreprise, associées aux technologies émergentes d’intelligence artificielle (ML/AI) et de registre distribué (blockchain) viennent challenger les solutions historiques et de plus en plus d’entreprises s’interrogent sur le devenir de leur existant souvent « progicialisé » ou externalisé (GED-as-A-service), dont les coûts sont historiquement jugées hors de proportions par rapport aux attentes opérationnelles, pire ne délivre pas les fonctions attendues.

L’occasion de faire un point sur les stratégies possibles sachant par ailleurs que la nature des documents à gérer par l’entreprise risque de profondément évoluer dans les années à venir, notamment en termes de preuve de véracité (identité, situation patrimoniale, adresse…) ainsi que leur variétés (conversation robotisée, empreinte de reconnaissance faciale…).

Des systèmes historiques à bout de souffle

Qu’elle soit entrante, sortante ou à vocation d’archivage, la GED vise à organiser et gérer les documents au sein de l’entreprise. Elle est au cœur des activités dématérialisées de l’entreprise, des processus de collaboration, de capitalisation et d’échange d’information et prend en charge la gestion de leur cycle de vie, de la création à l’archivage en passant par la gestion des différentes versions ou aspects réglementaires.

Une GED comporte classiquement les fonctionnalités suivantes :

  • La réception, numérisation, l’extraction et l’identification des métadonnées des documents
  • Le stockage, l’indexation et la classification des documents selon des critères prédéfinis (plan de classification)
  • La restitution (navigation et recherche) des actifs documentaires
  • La gestion de leur cycle de vie selon un calendrier de conservation (archives)

Des fonctions aujourd’hui mises à mal par l’accélération de la dématérialisation des processus étendue à l’ensemble des métiers de l’entreprise (vente, logistique, finance, ressources humaines…) et des canaux :

  • Une volumétrie toujours plus importante à gérer, passée de Go à To voire Po
  • Des métadonnées sous utilisées, associées à un plan de classification rigide
  • Des usages nécessitant d’y accéder en temps réel et par un nombre croissant d’acteurs avec au premier plan le client
  • Un besoin d’accès en self-service pour les clients pour modifier et consentir l’usage de leurs documents
  • Une variété des contenus comme jamais auparavant : textes, images, vidéos, son, logs de chatbots, traces d’interaction digitale, etc.
  • Une gestion du cycle de vie de plus en plus complexe et réglementé (justification de collecte, consentement, droit à l’oubli…)
  • Un besoin d’analyse en profondeur du contenu et de corrélation entre ces contenus, ne se limitant pas aux métadonnées usuelles, pour garantir la pertinence des documents collectés, respecter la réglementation et en tirer toute la valeur pour l’entreprise : légitimité de collecte (adresse, IBAN, numéro de carte d’identité…), détection de contenu sensible (relatifs à la santé, religion, politique), analyse de sentiments…
  • Une expérience utilisateur améliorée découlant de ces analyses, tout à la fois engageante (ne pas redemander des éléments valides déjà à disposition et inférer des éléments de documents déjà à disposition) et respectueuse de réglementation (ne pas disposer d’information indues) et de l’éthique de l’entreprise (ne pas utiliser d’informations au-delà de leur contexte d’usage sans consentement explicite)

A cela s’ajoute l’inévitable dimension économique de ce passage à l’échelle des données, métadonnées et usages attendus et pour lequel les solutions traditionnelles, même portées dans le cloud selon un modèle de paiement à l’usage, peinent à apporter des réponses satisfaisantes.

Quant aux autres solutions de gestion d’actifs digitaux multimédias type « DAM » ou « ECM », elles ne sont pas mieux loties et la tentative de convergence de certains progiciels GED vers une offre « tout en un » pour éviter la fragmentation documentaire entre de multiple solutions n’a pas convaincu, notamment à cause d’une non remise en cause des fondations technologiques et d‘un manque de compréhension des nouveaux usages du document intelligent.

Vers une GED nouvelle génération

Ces exigences poussent à l’évolution vers un nouveau paradigme d’architecture moins document-centric et plus data-centric offrant des ‘Content Services’ étendus à l’instar de ce que propose le Gartner. Une plateforme GED de nouvelle génération cassant les limites des systèmes existants et corrigeant leur défaut structurel :

  • plus holistique en variété de contenu pour réunir tous les actifs digitaux structurés et non structurés (texte, audio, vidéo, logs de chat…) dont la valeur ultime se révèle par leur corrélation et mise en relation
  • plus riche fonctionnellement en accès à l’information pour travailler sur des éléments d’autosuggestion et de recherche croisée au-delà des métadonnées usuelles, plutôt que sur des requêtes très structurées et pensées à l’avance
  • plus ouverte pour en permettre l’accès dans tout type de scénario métier, de manière omnicanal via des API
  • plus complète grâce à des services sur étagère, par exemple de reconnaissance de type de document, d’analyse d’image, de masquage de données ou encore d’extraction de métadonnées particulières
  • plus élastique au sens extensible en termes de volume, de stockage et d’accès et ce sans discontinuité de service et à moindre coûts
  • et surtout plus intelligente pour tirer toute la valeur du fond documentaire de façon unitaire ou ensembliste, en autorisant l’automatisation de son traitement (classification, conformité réglementaire…) et de son cycle de vie (pertinence de sa détention par l’entreprise, contrôle de validité et de véracité, archivage, anonymisation, purge…)

Mises bout à bout, l’ensemble de ces exigences conduisent naturellement à imaginer une GED dopée aux technologies Big Data, augmentée à l’intelligence artificielle, régentée à la blockchain et décloisonnée à l’API !

 

Un cocktail de technologies digitales à assembler

Big Data assurément

Même s’il a fort à parier que la nature des documents gérés dans les GED actuelles va profondément évoluer avec l’APIsation des services, remplacement d’une image numérique fidèle d’un document papier vestige de l’ère pré-digitale (preuve d’identité, de domicile, de solvabilité, données patrimoniales, bon de commande, contrat, bordereau logistique, facture…) par une simple trace d’appel à un tiers déposant (e.g. coffre-fort électronique, registre distribué) ou certifiant (e.g. trace d’un appel à un fournisseur d’énergie pour confirmer la validité d’une domiciliation en lieu et place d’une facture numérisée), leur nombre va exploser et le coûts de leur gestion, internalisée ou externalisée devenir rapidement problématique. Les technologies Big Data (base NoSQL pour la gestion des méta-données, cluster de fichiers pour le stockage des documents, framework de traitement massivement parallèle temps réel et batch) et leur emblématique réponse à l’équation dite des 3V (volume, variété, vélocité) vont y trouver une application naturelle et un usage tout trouvé des plateformes Big Data et autre lacs de données déployés dans les entreprises.

IA inévitablement

L’émergence de plateformes IA/ML cloud par les grands acteurs comme Amazon, Google, Microsoft et IBM a créé une accélération dans leur intérêt, leur démocratisation et « commoditisation ». Un grand nombre de services prêts-à-consommer et facturés à l’usage sont ainsi disponibles par simple appel d’APIs : reconnaissance de texte, détection de visages, comparaison de visages, analyse des sentiments, détection des sujets, analyse de vidéo ou transcription audio. A ces services déjà entrainés et en amélioration permanente sous l’effet de réseau s’ajoutent maintenant de nouvelles opportunités de spécialisation d’algorithmes simplifiées, comme avec Google AutoML, qui permettent aux entreprises de développer leur propre IA contextualisée en s’affranchissant de compétences pointues en Data Science et en plaçant la valeur sur le jeux de données d’entrainement et pas sous l’algorithmie complexe sous-jacente ni l’élasticité de l’infrastructure en performance et en coûts.

Ces services gérés par les fournisseurs Cloud ainsi que les services de Machine Learning simplifiés sont autant d’accélérateurs pour les entreprises qui peuvent ainsi exploiter leurs données documentaires de manière plus efficace, comme jamais auparavant et à moindre coût. Il est clair que les entreprises dotées ou déjà engagées sur la création d’un Data Lab sont idéalement placées pour constituer un jeu de données métier d’entrainement hyper contextualisé par exemple pour permettre une reconnaissance et une classification plus précise de documents non communs, chose que les GAFAM trop généralistes ne peuvent de fait pas proposer.

Intégrer Big Data et IA offre ainsi des opportunités sans précédent d’amélioration de l’expérience en front-office ainsi qu’en back-office :

  • extraction des données nécessaires au fonctionnement de l’entreprise (extraction de l’adresse du client et comparaison avec les données du CRM pour actionner un process de mise à jour de celles-ci par exemple)
  • génération dynamique de la classification des documents
  • ou encore identification des éléments non conformes (information de santé, politique ou religieuse)

Blockchain probablement
Qu’elle que soit l’intelligence mise autour du document, les questions immuables autour de chaque document persisteront comme validé et certifié par qui ? Transmis à qui ? Déposé avec quelle preuve ?

L’émergence des registres distribués de type blockchain permet d’envisager une nouvelle façon d’appréhender la réponse à ces questions par leur fonctionnalités intrinsèques :

  • gestion distribuée permettant de partager un même document entre l’ensemble des acteurs le nécessitant sans le dupliquer et en maitrisant la visibilité. On peut ainsi imaginer un registre national de nos documents identitaires voire au-delà un registre unique contenant tous les documents que nous devons usuellement fournir aux administrations, aux employeurs et aux entreprises commerciales avec lesquels nous sommes en relation (des initiatives privées sont d’ailleurs déjà en cours). A minima, il est probable que des registres spécialisés apparaissent (données identité, données santé, données patrimoniales, données judiciaires…) qui viendront soulager les documents à gérer en propre par l’entreprise pour ses interactions B2B et B2C et en donneront la maîtrise à l’écosystème et pas à un acteur unique,
  • gestion de la traçabilité des documents et capacité à horodater et conserver l’ensemble des accès opérés sur ces derniers,
  • mécanismes de validation/certification des documents signés (« Proof of Existence »),
  • garantie d’immuabilité, i.e. de non-altération des documents via leur empreinte unique conservée dans un block
  • mécanismes de smart contrat permettant d’automatiser certaines activités de gestion comme la (re)demande de document en cas d’expiration de validité par exemple.

Plateforme Data ou solution dédiée, « on premise » ou « Cloud » ?

Aujourd’hui, il n’est pas rare qu’une même entreprise dispose de plusieurs GED (GED entrante, GED sortante, GED opérationnelle, GED référentielle…) complétées par un système d’archivage dédié et que d’autre part elle se soit dotée d’une plateforme (big)Data dans sa stratégie d’évolution vers une entreprise data-driven. Dès lors quoi de plus naturel que de faire converger et migrer l’ensemble de ses GEDs vers cette plateforme data-centric en considérant qu’au fond cette dernière concentre toutes les primitives nécessaires en termes de stockage et traitement de masse à moindre coûts, de service de requêtage et de recherche étendue ainsi que la capacité d’exécution d’algorithmes avancées.

Dans une vision data-centrée de l’entreprise, l’ajout d’un service GED à la plateforme Data d’entreprise visant à fédérer tous les services ‘data’ de l’entreprise fait sens. Il permet de « désiloter » à la fois les métadonnées des documents ainsi que les données raffinées extraites de ceux-ci, et permettre une analyse croisée en masse à moindre coût avec les autres données de l’entreprise, par exemple dans l’optique d’une vue 360° client, vis-à-vis de la politique de gouvernance des données (indicateurs qualité & conformité…), la réglementation (KYC, GDPR, légalité d’acquisition versus la nature du processus…) et de lutte contre la fraude (usurpation d’identité…).

L’IA/ML ouvre une porte sur la valorisation des données documentaires, à la fois dans leur classification/catégorisation (générateur de métadonnées), mais aussi et surtout pour l’analyse du contenu et l’extraction de données portées par le document.

La mise en place de blockchains en complément de systèmes de gestion de document pourrait paradoxalement limiter grandement leur nécessité sur les pièces justificatives ainsi que sur les documents personnels, en limitant les redemandes et en basculant sur un échange automatisé entre tiers de confiance après validation des utilisateurs des services. On peut ainsi imaginer le partage direct d’un RIB entre la banque et un opérateur téléphonique après validation du client dans l’interface de la banque par exemple, le tout tracé dans une blockchain auditable par les trois parties.

Ces nouvelles capacités ouvrent donc une nouvelle opportunité de remettre le patrimoine documentaire des entreprises au centre de l’approche data-centric qu’elles sont en train de mettre en place, et remettent de fait en cause les systèmes monolithiques classiques des solutions de GED actuelles. Cela nécessite l’intégration d’un mix de technologies innovantes : Big Data (pour passer à l’échelle), API (pour exposer et valoriser la donnée), IA/ML (pour « augmenter » la donnée et les métadonnées), Blockchain (pour certifier la donnée) ainsi que la transposition de patterns d’implémentation GED à l’architecture Big Data ce qui est un défi important pour les organisations.

Enfin, selon leur maturité data-centric, les ressources et compétences à leur disposition et/ou leurs choix stratégiques en matière de plateformisation du SI, les entreprises pourront également s’orienter vers une plateforme « LowCode/NoCode » Cloud de type « Digital Asset Management » ou « Content Services », les grands offreurs historiques GED étant en train d’affirmer et peaufiner leurs offres SaaS et leurs modèles économiques.

Laisser une réponse

*