GPTBot ? C'est le robot d’indexation de ChatGPT capable de scanner les pages web afin d’en extraire des données
Le but de la collecte, selon OpenAI, est d’aider « ses modèles d’intelligence artificielle à devenir plus précis », mais aussi « améliorer leurs capacités générales et leur fiabilité ».
À l’époque, OpenAI précisait alors que GPTBot était capable « de filtrer et supprimer les sources qui nécessitent un accès payant, qui sont connues pour recueillir des informations personnelles identifiables (IPI) ou dont le contenu enfreint nos politiques ».
Nullement rassurées, plusieurs médias généralistes prennent l’initiative de restreindre l’accès à ce robot qui scanne leurs portails d'information : C’est le cas du New York Times, qui bloque l’accès à l’agent dès le 17 août, mais aussi, plusieurs publications adoptent la même démarche, comme le média britannique The Guardian, l’américain CNN ou l’agence de presse Reuters. En France : Les Échos a bloqué l’accès à GPTBot « à titre conservatoire », tout comme les groupes TF1, France Médias Monde et le site actu.fr.
Parmi les sites les plus visités au monde qui ont aussi restreint l’accès au robot, on retrouve notamment : Amazon, Quora, Shutterstock,, WikiHow, Foursquare, Tumblr, Ikea, Airbnb, Lonely Planet.
Une nouvelle guerre en perspective !
Le média britannique The Guardian, qui s’est positionné publiquement sur le sujet, invoque une collecte non autorisée de données protégées par le droit d’auteur en vue d’une exploitation commerciale.
On bloque pour mieux négocier ?
Selon Axios, tous les sites « sont actuellement en pourparlers avec des entreprises spécialisées dans l’IA pour céder leurs données en échange d’une commission, mais ces discussions ne font que débuter. »
Le comble de l'histoire, par soucis de transparence et sans doute pour rassurer les médias d’information et les plateformes quant à l’utilisation de leur contenu, OpenAI avait expliqué, elle même les étapes à suivre pour bloquer l’accès au robot d’indexation.
À l’époque, OpenAI précisait alors que GPTBot était capable « de filtrer et supprimer les sources qui nécessitent un accès payant, qui sont connues pour recueillir des informations personnelles identifiables (IPI) ou dont le contenu enfreint nos politiques ».
Nullement rassurées, plusieurs médias généralistes prennent l’initiative de restreindre l’accès à ce robot qui scanne leurs portails d'information : C’est le cas du New York Times, qui bloque l’accès à l’agent dès le 17 août, mais aussi, plusieurs publications adoptent la même démarche, comme le média britannique The Guardian, l’américain CNN ou l’agence de presse Reuters. En France : Les Échos a bloqué l’accès à GPTBot « à titre conservatoire », tout comme les groupes TF1, France Médias Monde et le site actu.fr.
Parmi les sites les plus visités au monde qui ont aussi restreint l’accès au robot, on retrouve notamment : Amazon, Quora, Shutterstock,, WikiHow, Foursquare, Tumblr, Ikea, Airbnb, Lonely Planet.
Une nouvelle guerre en perspective !
Le média britannique The Guardian, qui s’est positionné publiquement sur le sujet, invoque une collecte non autorisée de données protégées par le droit d’auteur en vue d’une exploitation commerciale.
On bloque pour mieux négocier ?
Selon Axios, tous les sites « sont actuellement en pourparlers avec des entreprises spécialisées dans l’IA pour céder leurs données en échange d’une commission, mais ces discussions ne font que débuter. »
Le comble de l'histoire, par soucis de transparence et sans doute pour rassurer les médias d’information et les plateformes quant à l’utilisation de leur contenu, OpenAI avait expliqué, elle même les étapes à suivre pour bloquer l’accès au robot d’indexation.
Affaire à suivre
OpenAI, pour contrer cette défiance vis-à-vis de GPTBot, avait mis en pause, début juillet, le « Browse with Bing », la fonctionnalité qui permettait à ChatGPT de naviguer sur le web pour fournir des réponses actualisées aux utilisateurs de l’offre premium ChatGPT Plus.