Après GPT-3, OpenAI présente GPT-4 l'IA générative multimodale


Rédigé par La Rédaction le Mercredi 15 Mars 2023

GPT-4 est en capacité d’intégrer un prompt composé d’un texte et d’une image. En revanche, les résultats fournis par GPT-4 se limiteront au format texte.
En lui montrant une image, GPT-4 est capable de la décrire et de l'analyser comme GPT-3 le fait avec du texte. Concrètement, si on lui demande ce qu'il se passerait si on coupait une ficelle qui retient des ballons, sa réponse fuse : "ils s'envoleraient !".



OpenAI GPT-4 présente les trois nouveautés majeures de son modèle de langage :

  Créativité : GPT-4 est capable de mieux répondre aux besoins créatifs de ses utilisateurs. OpenAI évoque la conception de tâches comme la composition musicale, l’écriture de scénarios et/ou la reproduction du style de l’auteur. Format : GPT-4 accepte donc les images en tant qu’entrées. Cette nouvelle capacité permet de générer des légendes, des classifications ou faire des analyses basées sur l’interprétation des images. Contexte : GPT-4 est capable de gérer plus de 25 000 mots, ce qui permet de créer des textes plus longs, participer à des conversations plus riches, réaliser des recherches plus complètes et des analyses de documents.

Bien que GPT-4 semble bien plus puissant – et plus précis – que GPT-3 et 3.5, OpenAI rappelle qu’un grand nombre de limitations et de risques associés à sa technologie restent présents et connus : préjugés sociaux, réponses inattendues…

L’objectif de l’éditeur est d’atténuer le plus possible les problématiques liées à ses modèles de langages afin d’éviter les utilisations malveillantes ou des résultats qui posent problème.

On verra si dans les prochains mois si les usages de GPT-4 permettent de gommer les limites de ChatGPT et des autres services basés sur les technologies d’OpenAI.




Mercredi 15 Mars 2023
Dans la même rubrique :