Un champ de chiens électriques. | VQGAN+CLIP
Un champ de chiens électriques. | VQGAN+CLIP

Cette IA génératrice d'images folles va vous occuper longtemps

Petit tutoriel pour vous couper le souffle et secouer votre imaginaire grâce à CLIP+VQ-GAN.

L'intelligence artificielle est un terme qui recouvre un peu tout et n'importe quoi, souvent accolé à toute chose nouvelle pour lui offrir un lustre de modernité et de futur.

Mais les intelligences artificielles –et les modèles qu'elles génèrent– peuvent être source de véritables merveilles, fantômes de machines et chimères algorithmiques, au croisement de la technologie et de la poésie.

C'est le cas des générateurs de textes, comme le puissant GPT-3, capable d'imaginer des histoires complètes et complexes –et parfois crédibles dans les moindres de leurs circonvolutions aux logiques sibyllines– à partir de quelques bribes de mots.

C'est également, et peut-être plus encore, le cas des générateurs d'images qui, nourris de vastes bases de données de photos et de dessins et animés par des algorithmes aux arcanes impénétrables, sont capables de produire à la volée des infinités de visions cinglées, telles des versions informatiques des explorations surréalistes de Salvador Dalí.

Nous sommes ainsi depuis quelques jours, sur Twitter, littéralement fascinés par les partages du compte Images Generated By AI Machines. Celui-ci fait un usage immodéré d'un système nommé CLIP+VQ-GAN et qui, sans connaissance informatique préalable, permet de créer des images synthétiques à partir de quelques mots que l'IA cherchera à interpréter et mêler.

Excellente nouvelle si votre imagination a besoin d'un peu de dopage synthétique: sans aucune connaissance informatique préalable, une version publique du système générant ces images a été mis en ligne par Katherine Crowson.

Basé sur les travaux de Ryan Murdock, il est utilisable par quiconque a le courage de cocher quelques cases et de se laisser surprendre par cette magie technique dont nous renonçons à expliquer les secrets.

La magie pas à pas

À suivre pas à pas et avec un minimum d'attention, un tutoriel a ainsi été écrit et publié. Pour celles et ceux ne lisant ni l'anglais, ni l'espagnol, nous vous le résumons ici. La première étape est de vous rendre à cette adresse: c'est dans ce Google Collab Notebook que tout se passera, et cela nécessite la connexion à un compte Google.

Il vous faut ensuite choisir les paramètres. Bonne nouvelle, vous pouvez a priori ne rien toucher et tout laisser tel quel. Si vous souhaitez élargir les banques d'images auxquelles VQGAN aura accès pour mouliner ses synapses artificielles, vous pouvez cocher autant de cases que vous le souhaitez dans la section «Selección de modelos a descargar», au risque d'alourdir ensuite le processus.

C'est dans la section «Parámetros» que tout se décide. En particulier le texte que vous souhaitez voir le système interpréter: dans le champ «textos» –logique!– vous entrerez le point de départ de la folie que vous verrez ensuite se créer sous vos yeux.

«Ancho» et «alto» correspondent à la largeur et à la hauteur, en pixels, de l'image souhaitée; ne choisissez pas une taille trop grande, au risque de tout faire capoter par manque de mémoire.

Le reste des paramètres peut être également modifié, mais nous vous laissons vous référer au tutoriel complet pour découvrir quels changements provoquent quels effets.

Une fois les paramètres choisis, il vous reste à exécuter l'ensemble des programmes menant à la génération d'image. Revenez en haut du document: de «Licensed under the MIT License» à «Carga de bibliotecas y definiciones», vous verrez une suite de symboles «lecture» (►), correspondant aux différents scripts à exécuter. Il vous faudra les cocher un à un, sans en oublier un seul (y compris «Parámetros») et en attendant la bonne exécution de chaque script, pour passer à la suite.

La suite, c'est la génération, un peu de patience puis le «Waouh!» qui risque immanquablement de surgir de vos mâchoires décrochées. Lorsque tous les premiers scripts ont été exécutés (si vous souhaitez tester l'outil plusieurs fois, laissez l'onglet ouvert et ils n'auront pas à l'être à nouveau), cliquez sur le symbole «lecture» à côté de «Hacer la ejecución...» et c'est parti, itération après itération, dans un cheminement fascinant.

C'est parti où? C'est parti très loin, et très bizarre: n'hésitez pas à partager vos créations (ou cocréations, pour être plus exact, n'oublions pas la machine) sur Twitter en mentionnant @koriifr.

En ce moment

Votre vieille voiture vaut désormais plus cher que quand vous l'avez achetée

Biz

Votre vieille voiture vaut désormais plus cher que quand vous l'avez achetée

L'occasion fait le larron.

Grosse, grosse frayeur pour la Station spatiale internationale

Tech

Grosse, grosse frayeur pour la Station spatiale internationale

Le module russe Nauka a donné quelques sueurs très froides à la Nasa.

«Link rot»: quand le web pourrit de l'intérieur

Et Cætera

«Link rot»: quand le web pourrit de l'intérieur

Des pans entiers du savoir humain tombent dans l'oubli.