Embauché il y a 2 ans pour digitaliser les process, Alexandre Aubry raconte tous les changements que cela a induit : transformation de l'organisation, de l'infrastructure matérielle et réseau, ouverture et décommissionnement progressif de l'ERP Cobol...
Nous avons assisté à la conférence client de l'entreprise Orange à Agile en Seine. Cet article vous propose de découvrir comment l'IA Gen devient déjà un atout incontournable chez certains clients.
Un bon mix d'indicateurs - des KPI classiques ainsi que des KPI personnalisés - devrait vous aider, à condition de respecter un principe essentiel : faites simple !
Il n'est pas évident de s'y retrouver dans toutes ces approches de mise en oeuvre de l'IA générative, voici un guide pour comprendre et choisir l'approche qui sera la plus adaptée à votre contexte.
En plus de présenter chaque approche, je vous propose de les comparer sur les axes d'analyses suivants :
🔵 Exactitude (dans quelle mesure les réponses peuvent-elles être exactes ?)
Complexité de la mise en œuvre (dans quelle mesure la mise en œuvre peut-elle être complexe ?)
🔵 Effort (Quel effort faut-il pour mettre en œuvre ?)
🔵 Coût total de possession (TCO) (Quel est le coût total de possession de la solution ?)
🔵 Facilité des mises à jour et des modifications (dans quelle mesure l'architecture est-elle faiblement couplée ? Dans quelle mesure est-il facile de remplacer/mettre à niveau les composants ?)
Présentation des approches
🔍Prompting : Parfaite pour les cas d'utilisation ne nécessitant pas un contexte de domaine profond, cette méthode offre une grande flexibilité sans nécessiter de compétences en programmation avancées.
🔍Génération Augmentée par la Recherche (RAG) : Idéale si vous cherchez à maintenir une haute qualité de réponse tout en ayant la possibilité de modifier différents composants (sources de données, embeddings, modèles de langage, moteurs vectoriels).
🔍Affinage (Fine-tuning) : Choisissez cette approche pour un contrôle accru sur l'artefact du modèle et la gestion de sa version, particulièrement quand les terminologies spécifiques au domaine sont cruciales.
🔍Entrainement de modèle (Training) : La route à prendre si aucune des options ci-dessus ne répond à vos besoins et que vous disposez de données bien organisées, d'une infrastructure sophistiquée et de budgets conséquents.
Comparatif de chaque approche
1. Ingénierie des Prompts :
Précision : Produit les résultats les moins précis par rapport aux autres méthodes, bien que les résultats puissent sembler impressionnants isolément.
Complexité de mise en œuvre : Relativement faible, nécessite peu ou pas de compétences en programmation.
Effort : Nécessite beaucoup d'efforts itératifs pour affiner les prompts et obtenir la réponse correcte.
Coût total de possession (TCO) : Assez faible, principalement lié à la maintenance des modèles de prompt.
Flexibilité aux changements : Très élevée, les modèles de prompts peuvent être facilement modifiés pour s'adapter à de nouvelles versions de FM ou à de nouveaux FM.
2. Génération Augmentée par la Recherche (RAG) :
Précision : Fournit des résultats de haute qualité, avec une précision améliorée par rapport à l'ingénierie des prompts grâce à l'utilisation de contextes spécifiques.
Complexité de mise en œuvre : Plus élevée que l'ingénierie des prompts en raison des compétences en codage et en architecture nécessaires.
Effort : Exige un niveau d'effort modéré, supérieur à celui de l'ingénierie des prompts.
Coût total de possession (TCO) : Plus élevé que pour l'ingénierie des prompts, en raison des multiples composants impliqués.
Flexibilité aux changements : La plus élevée, permettant des modifications indépendantes des différents composants.
3. Fine-tuning :
Précision : Produit des résultats très précis, potentiellement de qualité légèrement supérieure à celle de RAG, en fonction du cas d'usage.
Complexité de mise en œuvre : Plus élevée que pour l'ingénierie des prompts et RAG, nécessitant une expertise en science des données et en ML.
Effort : Plus important que pour les deux autres méthodes, même si le fine-tuning peut nécessiter relativement peu de données.
Coût total de possession (TCO) : Plus élevé que pour RAG et l'ingénierie des prompts en raison de la puissance de calcul requise et de la compétence technique nécessaire.
Flexibilité aux changements : Faible, car des changements dans les données ou les entrées nécessitent un nouveau cycle de fine-tuning.
4. Training :
Précision : Produit les résultats de la plus haute qualité, avec les chances les plus faibles d'erreurs par rapport aux autres approches
Complexité de mise en œuvre : La plus élevée, nécessitant une grande quantité de données, de l'expertise en science des données et en ML
Effort : Le plus élevé, impliquant un développement itératif considérable pour obtenir un modèle optimal.
Coût total de possession (TCO) : Le plus élevé, en raison des besoins élevés en matière de traitement de données et d'entraînement du modèle.
Flexibilité aux changements : La plus faible, car les mises à jour du modèle nécessitent de nouveaux cycles d'entraînement.
Nous avons assisté à la conférence client de l'entreprise Orange à Agile en Seine. Cet article vous propose de découvrir comment l'IA Gen devient déjà un atout incontournable chez certains clients.
Matrice Impact vs Effort, Méthode MoSCoW, Scorings RICE & ICE vous aideront à évaluer et prioriser vos projets de data science, pour maximiser les chances d'un résultat satisfaisant - et aligné avec les objectifs stratégiques de l'entreprise.
Nos constatations empiriques sur les bénéfices de l'IA générative sont désormais appuyées par une étude : Google a interrogé plus de 2500 entreprises sur leur usage de la GenAI et le ROI est bien présent !
Les IA génératives d’images sont formidables pour accélérer le processus créatif. D’ici à s’en servir en production, il y a un pas. Cette version 3 de l’IA de Google permet de l’envisager sérieusement.