2.2 | Aperçu : deux types de GenAI

Module IA axé sur la pratique V6

Dans ce module, vous aurez un aperçu de deux types fondamentaux de modèles d’IA générative. Vous apprendrez les différences entre les modèles de traitement du langage et de l’image, comprendrez leur fonctionnement et découvrirez des domaines d’application typiques pour ces deux technologies.

Ce que vous savez déjà & ce que vous allez apprendre

1. Modèles de langage (LLM)

Définition & Fonctionnement

Les grands modèles de langage (LLM) analysent d’énormes quantités de texte pour apprendre des motifs statistiques. Cela leur permet de comprendre des contextes et de générer des textes de type humain pour diverses tâches.

2. Modèles d’image

Définition & Fonctionnement

Les modèles de génération d’images convertissent des prompts textuels en images, souvent via un „processus de diffusion“ : en partant du bruit, une image est progressivement formée pour correspondre à la description textuelle.

De la théorie à la pratique : Conseils pratiques

Conseil 1 : Engagez un dialogue

Considérez les modèles de langage comme ChatGPT comme des partenaires de conversation. Commencez simplement et affinez progressivement le résultat dans le dialogue jusqu’à ce qu’il corresponde parfaitement à vos besoins.

Conseil 2 : Choisissez le bon outil pour l’amélioration d’image

Pour des résultats professionnels, l’amélioration ciblée d’une image (design itératif) est cruciale. Selon les besoins, il existe des outils adaptés.

Pour un démarrage rapide :

ChatGPT (avec DALL-E) : Idéal pour affiner une image en dialoguant. Après la première génération, donnez simplement des instructions de suivi comme „Change la couleur principale en bleu“ ou „Ajoute une personne en arrière-plan“.
Canva („Texte en Image“) : Parfait pour l’intégration dans le travail de conception quotidien. Vous générez une image et la modifiez immédiatement dans le contexte de votre présentation ou de votre publication sur les réseaux sociaux.

Pour les utilisateurs avancés & un contrôle maximal :

Midjourney : Offre des commandes puissantes pour la variation, le panoramique et le zoom, afin de développer une idée avec précision et de contrôler la composition.
Adobe Photoshop (avec Remplissage génératif) : Le premier choix pour les professionnels qui doivent intégrer, retoucher ou étendre des éléments générés par l’IA au pixel près dans des images existantes.

Conseil 3 : Créez une image de marque cohérente

Pour une image de marque professionnelle, les images (par exemple, pour une série de blogs) doivent avoir un style uniforme. On y parvient en fixant une „seed“ (graine). La seed est le point de départ aléatoire pour la génération de l’image.

Le processus est simple :

Créez un „visuel clé“ qui correspond parfaitement au style souhaité.
Fixez son numéro de seed et utilisez-le pour toutes les images suivantes.
Ne modifiez que la partie du prompt décrivant le sujet.

Résultat : Vous obtenez différents sujets qui ont tous le même caractère visuel. Des plateformes comme Midjourney ou des solutions professionnelles spécialisées, comme le générateur d’images de la plateforme xpandAI, offrent de telles fonctionnalités pour garantir une identité visuelle persistante.

Conseil 4 : Combinez les modèles de langage et d’image

Utilisez un modèle de langage comme assistant intelligent pour développer un prompt de première qualité pour un modèle d’image.

Exemple – Instruction à ChatGPT :

J'ai besoin d'un prompt très détaillé pour un modèle d'image. L'objectif est une image d'en-tête pour la page "À propos" d'une société de conseil en technologie.
- Sujet : Une équipe diversifiée travaille dans un bureau lumineux et moderne.
- Action : Ils discutent autour d'une table de conférence avec un graphique de données holographique et lumineux.
- Style : Photoréaliste, appareil photo professionnel, arrière-plan légèrement flou (bokeh).
- Couleurs : Le mobilier de bureau est neutre, le graphique de données doit reprendre les couleurs de notre marque (bleu vif et argent).
Crée à partir de cela un prompt concis en anglais.

Ce qu’il faut retenir

L’IA générative se divise en modèles de langage pour le texte et modèles d’image pour le visuel.
Pour des résultats professionnels, l‘amélioration itérative est cruciale. Choisissez l’outil adapté à la tâche, des options accessibles pour débutants aux outils professionnels.
Utilisez des techniques comme la fixation d’une „seed“ (graine) pour garantir une identité visuelle cohérente pour votre marque sur plusieurs images.
Utilisez les modèles de langage comme partenaires stratégiques pour développer des prompts de première qualité pour les modèles d’image et ainsi atteindre vos objectifs plus rapidement.