Reddit fa causa ad Anthropic per lo scraping dei dati AI


Reddit ha intentato una causa contro la startup di intelligenza artificiale Anthropic, sostenendo che l’azienda ha fatto scraping e utilizzato senza autorizzazione i dati dei contenuti di Reddit per addestrare i suoi modelli linguistici.

La causa, depositata presso la Corte Superiore della California a San Francisco, sostiene che Anthropic ha copiato sistematicamente e riprodotto contenuti protetti da copyright da Reddit per addestrare e sviluppare la sua famiglia di modelli linguistici Claude.

Reddit afferma che Anthropic ha sfruttato la piattaforma per ottenere un vantaggio commerciale, senza rispettare i termini d’uso del sito o ottenere una licenza.

“Anthropic non ha mai chiesto il permesso a Reddit per utilizzare la sua piattaforma in questo modo, e Reddit non ha mai concesso tale permesso,” si legge nel reclamo.

Secondo Reddit, Anthropic ha effettuato oltre 100.000 richieste alla piattaforma Reddit tramite bot automatizzati da luglio 2023, dopo che Reddit aveva iniziato a limitare l’accesso alle sue API pubbliche.

Il reclamo sostiene che Anthropic ha continuato a utilizzare questi dati anche dopo che Reddit aveva aggiornato i suoi termini d’uso per vietare espressamente tali pratiche. Reddit afferma che questo comportamento viola le leggi sul copyright, la violazione contrattuale e la concorrenza sleale.

Questa causa arriva mentre Reddit sta cercando di monetizzare i propri dati attraverso accordi di licenza. La società ha recentemente firmato un accordo di licenza da 60 milioni di dollari all’anno con Google per l’utilizzo dei suoi dati nell’addestramento dell’intelligenza artificiale.

Reddit ha dichiarato che i dati degli utenti sono una risorsa preziosa e che l’uso non autorizzato da parte di aziende di IA mette a rischio la sostenibilità della comunità e degli affari.

Anthropic non ha ancora risposto pubblicamente alla causa.

Nuova Vecchia

نموذج الاتصال