Litige entre Reddit et Anthropic autour des contenus utilisés pour l’IA

Image d'illustration. Reddit ADN
Anthropic fait face à une plainte de Reddit pour extraction massive et non consentie de données.
Tl;dr
- Reddit accuse Anthropic d’avoir extrait illégalement ses données pour entraîner son IA sans autorisation.
- Le réseau social dénonce un accès automatisé non consenti à ses serveurs et un refus de dialogue autour d’un accord de licence.
- Anthropic rejette ces accusations, sur fond de tensions croissantes entre éditeurs de contenus et développeurs d’IA.
Escalade judiciaire entre Reddit et Anthropic
Depuis quelques années, la tension ne cesse de monter autour de l’utilisation des contenus publiés sur la plateforme Reddit. Cette fois, le conflit a franchi un nouveau cap : l’entreprise américaine vient d’attaquer en justice la start-up d’intelligence artificielle Anthropic, accusée d’avoir puisé massivement dans ses archives sans autorisation. En toile de fond, la bataille qui oppose désormais les géants du web aux créateurs de modèles génératifs avides de données.
Données précieuses et enjeux commerciaux
Le cœur du litige réside dans l’exploitation de ce que Reddit décrit comme une « mine d’or » informationnelle. Alors que l’entreprise a récemment scellé des accords lucratifs avec des poids lourds comme Google ou OpenAI, elle affirme que Anthropic, concepteur du chatbot Claude, aurait exploité ses contenus « dès décembre 2021 ». Les captures d’écran jointes au dossier judiciaire viendraient étayer cette affirmation, montrant que Claude reconnaît explicitement avoir été entraîné à partir de discussions issues de Reddit.
Les dirigeants du réseau social ne cachent plus leur agacement face à ces pratiques : selon eux, malgré plusieurs avertissements et demandes répétées, Anthropic aurait accédé à leurs serveurs par le biais de robots automatisés au moins 100.000 fois. Voici les reproches formulés par Reddit à l’encontre d’Anthropic :
- Détournement massif des contenus sans respecter les droits ni la vie privée des utilisateurs ;
- Refus systématique de dialoguer autour d’un éventuel accord de licence ;
- Difficulté à garantir le retrait effectif des messages supprimés.
Lignes rouges et stratégies divergentes
Pour Reddit, cette action judiciaire constitue « la dernière option » afin de contraindre son adversaire à cesser ses pratiques jugées illicites. Le porte-parole n’y va pas par quatre chemins : « Nous croyons en l’Open Internet — cela ne donne pas à Anthropic le droit de s’emparer illégalement du contenu Reddit, d’en tirer des milliards et d’ignorer nos utilisateurs », martèle-t-il.
Il faut rappeler qu’au fil des mois, Reddit a nettement durci sa politique envers les collecteurs automatiques (« scrapers »), multipliant les blocages techniques et exigeant une rémunération pour toute exploitation commerciale massive.
Démenti formel chez Anthropic
De son côté, un porte-parole d’Anthropic se défend : « Nous contestons les allégations portées par Reddit et nous allons assurer notre défense avec détermination ». Ce litige marque un jalon supplémentaire dans la redéfinition mouvementée des règles entourant l’accès aux données publiques à l’ère de l’intelligence artificielle générative.