La créativité est-elle un signe d’intelligence ? Peut-on être libre sous la contrainte ? Autant de questions philosophiques qui pourraient s’appliquer à l’IA générative. Depuis quelques mois, on entend de plus en plus parler de ce nouveau concept de génération d’images grâce à l’intelligence artificielle (IA). Peut-être avez-vous vu passer les noms de DALL-E (GPT-3), MidJourney ou encore Stable Diffusion, pour ne citer que les outils les plus connus.
Ils sont capables de créer en une poignée de secondes une peinture, une photo ou un dessin sur la base d’une simple phrase descriptive. Cela peut être « un astronaute sur un cheval », mais aussi « rendu en 3D coloré d’un robot artiste joyeux en train de peindre une peinture avec des rayures », ou encore « vue panoramique d’une chaise dans le style pop art sur fond de forêt ». S’agit-il pour autant d’une œuvre artistique ?
Ils sont capables de créer en une poignée de secondes une peinture, une photo ou un dessin sur la base d’une simple phrase descriptive. Cela peut être « un astronaute sur un cheval », mais aussi « rendu en 3D coloré d’un robot artiste joyeux en train de peindre une peinture avec des rayures », ou encore « vue panoramique d’une chaise dans le style pop art sur fond de forêt ». S’agit-il pour autant d’une œuvre artistique ?
« Je ne crois pas que la machine crée quelque chose, indique Monty Barlow, directeur de l’apprentissage machine chez Cambridge Consultants. Elle prend un domaine dans lequel les humains sont extrêmement bons et elle trouve les mécanismes derrière. Mais il faut toujours que nous lui donnions une entrée initiale. »
IA générative : des programmes créatifs sous contraintes
Concrètement, il s’agit d’un réseau de neurones artificiels capable de résoudre des problèmes complexes, en l’occurrence la création d’images, suite à un apprentissage sur la base de millions d’images et de légendes associées. Les algorithmes apprennent peu à peu des styles artistiques (dessiner comme Van Gogh), les caractéristiques des êtres vivants (représenter un bébé, un tapir), des émotions (la joie, la peur…) ou encore des lieux (à la plage, au pied de la tour Eiffel…).
Ensuite, la puissance des calculateurs et les algorithmes d’intelligence artificielle permettent de créer des images originales en partant de contraintes (les instructions données par une requête formalisée par une personne) et en les adaptant à de nouvelles situations. À chaque fois que l’on soumet une requête, aussi appelée « prompt », le système va créer un nouveau visuel, assez proche du précédent ou très différent. C’est cette variable aléatoire dans l’algorithme qui est ce qu’on peut imaginer de plus proche de la créativité humaine.
Ensuite, la puissance des calculateurs et les algorithmes d’intelligence artificielle permettent de créer des images originales en partant de contraintes (les instructions données par une requête formalisée par une personne) et en les adaptant à de nouvelles situations. À chaque fois que l’on soumet une requête, aussi appelée « prompt », le système va créer un nouveau visuel, assez proche du précédent ou très différent. C’est cette variable aléatoire dans l’algorithme qui est ce qu’on peut imaginer de plus proche de la créativité humaine.
L’art de parler à l’intelligence artificielle ou des heureux accidents ?
Ces « heureux accidents » sont ce qui plaît à Geoffrey Dorne, designer indépendant de 37 ans qui s’est lancé dans le « prompt art » depuis début 2022 et a partagé sur son compte Twitter des images générées par IA. Son concept ? Via le hashtag #IAFP, il crée des images collant avec des titres d’actualité de l’agence de presse AFP.
« J’adore tester les toutes dernières innovations tech. Mais je ne teste jamais dans le vide. Sur Twitter, j’avais remarqué que les infos de l’AFP étaient régulièrement non illustrées ou avec des illustrations ‘prétexte’. Je voulais voir si l’IA pouvait régler ce problème », explique-t-il.
Mais comment parler à un outil d’IA Générative ? Si on peut imaginer au départ que c’est un peu comme apprendre à formuler une recherche dans Google, les prompts peuvent être bien plus complexes.
« J’ai appris les bases du langage des signes il y a quelques années et je m’aperçois que cela me sert beaucoup pour créer des prompts car il faut vraiment être très descriptif, souligne le designer. Pour évoquer une poignée de porte, le langage des signes va décrire son usage (une barre en métal sur laquelle on appuie pour ouvrir une porte).C’est la même chose avec l’IA Générative. Si on a une idée précise en tête, il faut tout décrire : quel sujet, quel angle de la caméra, quel filtre artistique, veut-on un cadrage centré ou décalé, quelle texture, imagine-t-on une image avec beaucoup de couleur ou neutre, souhaite-t-on une photo ou une peinture, etc. »
L’épineuse question des droits d’auteur
L’IA générative pourrait-elle un jour remplacer les artistes ? Cela semble peu probable. « Tout le monde peut faire un prompt, c’est vrai, mais les illustrateurs ou encore les photographes sont à l’affût de milliers de petits détails (regard unique sur un sujet, angle, contexte, narration, propos à tenir, etc.). On peut aussi avoir un engagement politique et social qui se retranscrit dans nos créations, ce qu’une IA n’aura jamais », note le designer.
Reste la question du droit d’auteur. Geoffrey Dorne crédite et vend les créations imaginées par IA grâce à ses prompts mais il met un point d’honneur à toujours les retravailler a posteriori pour améliorer le résultat et l’adapter davantage à son goût. « C’est un peu à l’image des premiers samples de la musique hip-hop. Là, les IA vont piocher dans des millions voire des milliards d’images. Et c’est mon prompt qui va donner vie à une nouvelle création. » Il n’est pas seul : on trouve de plus en plus de ces créations par IA sur des banques d’images ayant pignon sur rue, comme Shutterstock. Elles sont identifiées comme telles et vendues de la même manière qu’une photo ou un dessin.
Est-ce vraiment légal ? Betty Jeulin, avocate en droit numérique, explique qu’il existe encore un grand flou en termes de législation. « seul un être humain peut être l’auteur d’une oeuvre et créer une oeuvre originale. Or, dans le cas du Prompt Art comme Dall-E, SnowPixel, MidJourney… on considère qu’il n’y a pas d’intervention humaine dans la création même de l’image. Et le robot ne bénéficie d’aucun droit. » Impossible donc de qualifier ces créations comme des « œuvres de l’esprit » et on tombe alors dans une sorte de vide juridique.
Rédigé par Florence Santrot, repris et adapté par la Fondation Tamkine
#Tamkine_ensemble_nous_reussirons
Reste la question du droit d’auteur. Geoffrey Dorne crédite et vend les créations imaginées par IA grâce à ses prompts mais il met un point d’honneur à toujours les retravailler a posteriori pour améliorer le résultat et l’adapter davantage à son goût. « C’est un peu à l’image des premiers samples de la musique hip-hop. Là, les IA vont piocher dans des millions voire des milliards d’images. Et c’est mon prompt qui va donner vie à une nouvelle création. » Il n’est pas seul : on trouve de plus en plus de ces créations par IA sur des banques d’images ayant pignon sur rue, comme Shutterstock. Elles sont identifiées comme telles et vendues de la même manière qu’une photo ou un dessin.
Est-ce vraiment légal ? Betty Jeulin, avocate en droit numérique, explique qu’il existe encore un grand flou en termes de législation. « seul un être humain peut être l’auteur d’une oeuvre et créer une oeuvre originale. Or, dans le cas du Prompt Art comme Dall-E, SnowPixel, MidJourney… on considère qu’il n’y a pas d’intervention humaine dans la création même de l’image. Et le robot ne bénéficie d’aucun droit. » Impossible donc de qualifier ces créations comme des « œuvres de l’esprit » et on tombe alors dans une sorte de vide juridique.
Rédigé par Florence Santrot, repris et adapté par la Fondation Tamkine
#Tamkine_ensemble_nous_reussirons