Imagen 3 ancre la génération d’images dans les processus d’entreprise

Les développeurs doivent trouver une nouvelle forme de créativité

L'intégration de l'IA générative dans les processus de développement transforme radicalement l'expérience développeur, ainsi que les *soft* et *hard* skills attendues.

FinOps Framework 2025 : passer d’un pilotage budgétaire à une stratégie d’influence technologique

Avec sa mise à jour 2025, la FinOps Foundation fait tomber les cloisons : désormais, toutes (ou presque) les ressources IT — SaaS, datacenters, IA, cloud public — entrent dans le radar

Imagen 3 ancre la génération d’images dans les processus d’entreprise

Les IA génératives d’images sont formidables pour accélérer le processus créatif. D’ici à s’en servir en production, il y a un pas. Cette version 3 de l’IA de Google permet de l’envisager sérieusement.

Il y a les IA génératives qui se prennent pour des artistes cubistes ou surréalistes, recomposant des mains ou des visages à l’aide de formes géométriques disposées plus ou moins au hasard, et inventant des signes cabalistiques en guise d’alphabet. Et puis il y a Imagen 3. Désormais disponible sur demande, la toute dernière édition du moteur de génération d’images de Google rebat les cartes ; sa capacité à produire des gens, des objets, des textures mais aussi du texte réalistes nous a bluffés.

De quoi envisager plutôt sereinement d’introduire la génération d’images dans des process métiers en entreprise. Un vrai changement.

Le même prompt utilisé avec DallE 3 et Imagen 3 : rendu beaucoup plus réaliste du côté de Google, y compris sur le lettrage.

“Attention, tout n’est pas parfait, tempère rapidement Matthieu Blanc, Machine Learning Product Specialist chez Google Cloud. Si les produits sont depuis longtemps dans le domaine public, Imagen 3 saura très bien les reproduire, mais ce ne sera pas le cas avec un tout nouveau produit lancé par une marque.” Dans ce cas, c’est une astuce introduite avec Imagen 2 qu’il faudra appliquer : un détourage automatique du produit et sa mise en situation réaliste (jusqu’à l’ombre portée).

De même, si les progrès en matière d’écriture sont spectaculaires, il arrive encore à l’IA d’oublier un mot, ou d’utiliser une sorte de lorem ipsum pour les mentions en petits caractères. “Plus il y a de texte, plus il y a de possibilités d’erreur, souligne Matthieu Blanc. Faire un gros titre, un nom de marque, ou un petit dialogue, cela fonctionne bien. Il faut tester les prompts.”

Le même prompt utilisé avec DallE 3 et Imagen 3 : la calculatrice d’Imagen n’est pas encore parfaitement rendue, mais elle parvient à positionner correctement les chiffres.

Cette possibilité de faire dialoguer des personnages sera complétée d’ici quelques mois d’une fonctionnalité permettant de générer de nouvelles versions d’un personnage à partir d’un petit jeu de photos. “C’est très impressionnant et cela fonctionne aussi avec des objets, explique Matthieu Blanc. Mais attention, car dans le cas de produits, la fidélité à 100% n’est pas garantie.” Pour exposer correctement plusieurs versions d’un même produit - une voiture, un canapé dans un intérieur design, etc. - il faudra éventuellement passer par une étape intermédiaire : demander à l’IA d’analyser une image et d’en créer une version filaire, qui permettra de générer autant d’images qu’on souhaite avec de nouvelles textures, couleurs, etc.

Le même prompt utilisé avec DallE 3 et Imagen 3 : l’exercice de juxtaposer 2 styles différents est périlleux ; le contraste est saisissant côté Imagen.

Comme souvent avec Google, il faudra montrer patte blanche pour avoir accès à cette nouvelle version de l’IA ; les entreprises ayant de véritables cas d’usage professionnels en tête ne devraient avoir aucun mal à y avoir accès. Le formulaire de demande d'accès est disponible depuis Vertex AI, dans la console Google Cloud. Il est temps d’intégrer sérieusement la génération d’images dans les business cases.

GenAI

Les développeurs doivent trouver une nouvelle forme de créativité

L'intégration de l'IA générative dans les processus de développement transforme radicalement l'expérience développeur, ainsi que les *soft* et *hard* skills attendues.

Aurélien Pelletier 24 mars 2025

GenAI

Les systèmes agentiques : les défis derrière l'engouement

Les systèmes agentiques connaissent une vogue extraordinaire qui masque parfois leurs limites et les défis qu'ils soulèvent.

Malik Tazakkati 19 mars 2025

Culture

Le futur du travail en 2025 : dépasser les fantasmes, agir sur les réalités

Les discours sur l’avenir du travail oscillent souvent entre euphorie technologique et scénario catastrophe. D’un côté, l’IA nous promet un monde plus efficace, de l’autre, elle signe l’arrêt de mort de milliers d’emplois. Entre ces deux extrêmes, la réalité est évidemment plus complexe.

François Denis 11 mars 2025

GenAI

IA Generative : pas de cas d'usage sans USAGE !

Exiger des cas d’usage sans usage revient à inverser la logique naturelle d’adoption : ce n’est pas en décrétant où la GenAI sera utile qu’elle sera utilisée, mais en la rendant accessible à tous, pour qu’elle s’infiltre progressivement dans les pratiques et révèle son potentiel dans le temps.

Aude Defretière 21 févr. 2025