Embauché il y a 2 ans pour digitaliser les process, Alexandre Aubry raconte tous les changements que cela a induit : transformation de l'organisation, de l'infrastructure matérielle et réseau, ouverture et décommissionnement progressif de l'ERP Cobol...
Nous avons assisté à la conférence client de l'entreprise Orange à Agile en Seine. Cet article vous propose de découvrir comment l'IA Gen devient déjà un atout incontournable chez certains clients.
Un bon mix d'indicateurs - des KPI classiques ainsi que des KPI personnalisés - devrait vous aider, à condition de respecter un principe essentiel : faites simple !
La gouvernance de la donnée, gardien de la fiabilité des LLM
L'expertise dans les domaines de la data et l'IA n'est pas seulement une compétence technique, mais aussi une nécessité stratégique. Les entreprises qui s'engagent dans cette voie s’équipent pour réussir dans un avenir où la data et l'IA sont au cœur de l’innovation et de la création de valeur.
L’enthousiasme autour de l'IA générative est palpable dans le secteur technologique et au-delà. Cependant, la réussite de son intégration dans le monde professionnel repose sur une prémisse fondamentale : la gouvernance des données alimentant ces systèmes. Les large language models (LLM) comme GPT-4 en sont des exemples flagrants ; ils démontrent une capacité impressionnante à générer des textes, répondre à des questions et interagir en langage naturel. Néanmoins, si l'adage 'Garbage in, garbage out' illustre parfaitement la condition sine qua non de la performance de ces modèles : les données de qualité médiocre engendrent des résultats non fiables.
L'implication est claire : investir dans une gouvernance des données forte est indissociable de l'utilisation responsable et efficace des LLM.
Et la gouvernance des données ne se limite pas à la qualité et l'intégrité des datasets. Elle englobe également la sécurité des informations, leur conformité réglementaire, et l’assurance que chaque donnée utilisée respecte la confidentialité des individus et les directives telles que le RGPD pour l'Europe. Une gouvernance robuste garantit que les données sensibles sont gérées de manière sécurisée et que les modèles d'IA générative fonctionnent dans des cadres contrôlés.
“Science sans conscience n’est que ruine de l’âme”
Il est crucial de comprendre les risques et les limites liés à l'utilisation des LLM sans une gouvernance efficace de la donnée. Les données de mauvaise qualité peuvent fausser les résultats et conduire à des erreurs coûteuses pour une entreprise. Les LLM peuvent reproduire les biais existants dans les données d'entraînement, ce qui peut entraîner des discriminations et des inégalités. Les décisions prises par les LLM peuvent donc être difficiles à expliquer et à justifier, créant ainsi des défis en termes de conformité réglementaire et de responsabilité.
L'article intitulé "Why Chief Data and AI Officers Are Set Up to Fail" de Randy Bean et Allison Sagraves soulève des préoccupations concernant les rôles de Chief Data & AI Officer (CDAIO) à soutenir des programmes de gouvernance au sein des entreprises. Ces rôles sont de plus en plus importants alors que les entreprises naviguent dans le paysage croissant de l'IA générative et d'autres outils puissants liés aux données.
L'article met en évidence le fait que de nombreuses entreprises échouent à aligner ces rôles avec les objectifs de l'entreprise et à leur donner les moyens de réussir. Selon les données d'enquête, bien que le nombre d'entreprises ayant nommé un CDAIO ait considérablement augmenté ces dernières années, seules 35,5% des grandes entreprises déclarent que le rôle est couronné de succès et bien établi.
C’est d’ailleurs parfaitement décrit dans l’article “Cdiscount met l'IA générative au service du conseil aux internautes” écrit par Reynald Fléchaux qui partage un retour d’expérience sur le déploiement industriel d’un cas d’usage d’IA générative.
L'expérience de Cdiscount illustre cette réalité incontournable. Dans les premiers déploiements de leur IA générative, l'entreprise a été confrontée à des modèles produisant des recommandations basées sur des catalogues produits non reflétant leur inventaire actuel. Ce décalage a conduit à une incohérence flagrante entre les suggestions de l'IA et les produits disponibles, soulignant l'importance de la gouvernance des données pour assurer la cohérence et l'utilité pratique des LLM dans les opérations commerciales. En raison de ce problème, Cdiscount a décidé d'écarter temporairement les recommandations de produits de l'utilisation de l'IA générative.
Comment inscrire l’IA dans la durée
La gouvernance de la donnée est la solution clé pour maximiser les avantages des LLM tout en minimisant les risques associés.
En investissant dans une gouvernance efficace de la donnée, les entreprises peuvent s'assurer de la qualité, de l'intégrité et de la diversité des données utilisées pour entraîner les LLM. Cela implique d'établir des politiques, des processus et des contrôles rigoureux pour la collecte, le nettoyage et la validation des données. De plus, cela nécessite la mise en place de normes de sécurité élevées pour protéger la confidentialité des données.
En documentant le processus de création des jeux de données, en suivant les modifications apportées aux modèles de LLM et en conservant une traçabilité des décisions, les entreprises peuvent répondre aux exigences réglementaires et maintenir leur responsabilité.
De plus, la gouvernance de la donnée permet de prévenir certaines dérives dans l'utilisation des LLM. En veillant à la diversité et à la représentativité des données, les entreprises peuvent par exemple réduire les biais et garantir une utilisation éthique des LLM.
La gouvernance de la donnée est essentielle pour résoudre les problèmes et maximiser les avantages de l'utilisation des LLM au sein des entreprises. En s'assurant de la qualité des données, de l'explicabilité des décisions et en prévenant les dérives éthiques, les entreprises peuvent utiliser les LLM de manière efficace et responsable. Il est donc crucial de mettre en place une forte gouvernance de la donnée pour exploiter pleinement les possibilités offertes par les LLM.
Un bon mix d'indicateurs - des KPI classiques ainsi que des KPI personnalisés - devrait vous aider, à condition de respecter un principe essentiel : faites simple !
Entre une organisation qui s'est constituée de manière... organique, et le désir d'être data-centric ou au moins de valoriser les données, il y a un fossé. Commencer par repenser ses chaînes de valeur data s'avère un excellent point de départ.
Agile en Seine 2024 s'annonce comme une opportunité unique pour nos dirigeants de s'immerger dans les dernières avancées en matière d'agilité, de data et d'IA. Nous participerons à cet événement pour recueillir et partager des insights stratégiques.
Matrice Impact vs Effort, Méthode MoSCoW, Scorings RICE & ICE vous aideront à évaluer et prioriser vos projets de data science, pour maximiser les chances d'un résultat satisfaisant - et aligné avec les objectifs stratégiques de l'entreprise.