DALL.E : FAISONS LE POINT

Temps de lecture : 1 minute
mots-clés : IA, AI, pictures, photos, visages, dessins, drawings, faces

Chers lecteurs,

Voici quelques semaines, je vous avais parlé de DALL.E, une IA qui se basait sur l’ensemble des photos auxquelles elle avait accès pour « construire » de nouvelles photos.

Pour plus d ’explications sur le concept et ses principes : DO YOU KNOW DALL.E 2? IT’S A POWERFUL IA WHICH WILL IMPRESS YOU (15 juin 2022).

A cette époque, DALL.E (vous aurez compris le jeu de mots : Dali) était en mode « beta test» et est aujourd’hui en phase de maturité. Elle va pouvoir être plus ouverte au public et de manière payante. Toutefois, l’IA démontre déjà tout son potentiel et ses limites.

Quelques exemples, pour rappel on énonce une phrase et ensuite elle produit l’image en relation avec ce texte. Plusieurs itérations sont possibles :

Construis-moi une église en montagne dans des champs de blé
Cette église doit avoir une toiture verte et un clocher à 3 pans
Le blé doit être dans les mêmes tonalités que les vitraux de l’église

Et ainsi de suite.

Exemple 1 (Gideon Davidson):

« A photograph of a fox making friends with a rabbit, in a desert at midnight, with a full moon.”

Exemple 2 (Mon Sar):

« Sun Halo » (une des 4 photos est une vraie photo, les 3 autres sont des images reconstituées par Dall.E

Exemple 3 (Jet Rai)

« Minotaur reading a book »

Exemple 4 : (Dalle2.gallery)

« leonardo da vinci drawings of the sagrada familia »

Mais tout n’est pas au point et démontre qu’il y a encore de la marge (c’est un peu rassurant !). En effet, les visages sont détaillés lorsqu’ils sont vus de près, ensuite, les visages… regardent dans le vide. C’est le cas des 4 photos suivantes. Dans cet exemple, l’auteur a d’abord travaillé sur le détail du visage et ensuite a demandé qu’il soit intégré avec un comportement lié à une voiture de sport.

Globalement, les images des personnes sont vides de sens, particulièrement dans le regard. En outre, les représentations sont bourrées de stéréotypes (la femme est sexy, l’homme est fort et musclé). En ce sens, les bais humains se retrouvent dans la machine et ses bases de données (qui sont des photos du monde entier… faites par des êtres humains, ne l’oublions pas).

Pour ceux qui ont suivi Dall.E 1 et la version actuelle n°2, ou encore Midjourney qui est une AI du même type, c’est assez bluffant de voir l’évolution qui est exponentielle dans le temps. Enfin, dernier avis pour les architectes : si vous dessinez un projet ou une idée, vous pouvez l’intégrer à la machine et lui demander de l’illustrer à partir de vos intentions (ci-dessous le travail de Bren Chua) : « un bâtiment à la Blade Runner », etc. Les graphistes n’ont qu’à bien se tenir.

Merci de cette lecture.

Pascal SIMOENS Architecte et urbaniste, data Scientist. Expert Smart Cities. J’ai commencé ma vie en construisant des villes en Lego, j’en ai fait mon métier. Geek invétéré, aujourd’hui je joins mes passions du numérique et de la ville au travers d’une expertise smart Cities et smart buildings en travaillant en bureau d’étude (Poly-Tech Engineering) et j’enseigne cette même expertise à l’UMONS et l’ULB.