Le cas de l’hallucination de l’IA
Les images générées par l’IA deviennent de plus en plus réalistes. De la première version de DALL-E en 2021 au dernier modèle de Midjourney, la trajectoire est claire. Les images réalistes peuvent être plus agréables pour les téléspectateurs et plus impressionnantes pour les utilisateurs qui les génèrent, mais d’un point de vue créatif, les images d’IA deviennent plus similaires et moins surprenantes. Quand sont-ils devenus ters ? Comment le mystère et la poésie des premières images de l’IA ont-ils disparu ?
Au cours des derniers mois, les fabricants d’outils d’IA ont travaillé dur pour limiter les hallucinations d’IA. Pour les grands modèles linguistiques (tels que ChatGPT), lutter contre les hallucinations signifie s’assurer que le chatbot ne citera pas de fausses publications scientifiques ou des décisions judiciaires. Pour la génération d’images, cela signifie éviter les images oniriques et étranges. Comme nous faisons plus confiance à ces outils, cela a beaucoup de sens. Surtout dans un usage factuel : lors de l’écriture d’un article ou de la génération de photographies de stock, vous ne voudriez pas laisser l’IA trop se demander. Mais dans un usage créatif, lorsque les images et les mots sont destinés à ouvrir des possibilités, lorsque vous cherchez à produire quelque chose de nouveau, ces outils semblent moins utiles et plus difficiles à utiliser. La poésie a-t-elle disparu avec les hallucinations ?
Google DeepDream, Quelle était autrefois la vue vers Chase, Colombie britannique, James Temperton, Wired
Nouveaux pixels
Le terme hallucination de l’IA est utilisé pour la première fois en 2000 dans le domaine de la vision par ordinateur : il signifiait créer de nouveaux pixels sur les images des caméras de surveillance pour augmenter leur résolution. L’algorithme a appris des pixels originaux pour en générer de nouveaux qui semblaient crédibles.
15 ans plus tard, Google a lancé DeepDream. Basé également sur un algorithme de reconnaissance faciale, il inverse sa fonction : au lieu de chercher des visages, DeepDream les ajoute à n’importe quelle image pour créer des images étranges et psychédéliques. Avec DeepDream, le mot hallucination prend tout son sens : à la fois comme le processus de création de nouveaux pixels par la machine et comme l’expérience dans laquelle nous voyons quelque chose qui n’existe pas.
Au départ, le terme hallucination avait une signification positive, considérée comme quelque chose dont il faut profiter. Mais récemment, le sens du mot a changé. Aujourd’hui, Wikipédia le définit comme « une réponse confiante d’une IA qui ne semble pas justifiée par ses données de formation ». Les hallucinations ne sont-elles que des erreurs ?
Pourquoi les images de Midjourney ressemblent à celles de Midjourney
Pour avoir une meilleure idée de l’évolution des images d’IA, j’ai effectué une petite série de tests empiriques avec Midjourney. J’ai commencé avec des invites que j’ai utilisées pour un projet l’année dernière. Ces invites sont délibérément vagues et abstraites, l’objectif était de produire des images inspirantes, au début d’un processus créatif. Grâce à l’outil de la version de Midjourney, j’ai pu tester les invites dans différentes versions du logiciel, de la v1 à la plus récente v5.2. Voici à quoi cela ressemble pour chaque invite.






