Reddit судиться з Anthropic за використання даних сайту для навчання ШІ-моделей без належної ліцензійної угоди, йдеться в позові, поданому в середу до суду Північної Каліфорнії. Reddit стверджує, що несанкціоноване використання Anthropic даних сайту в комерційних цілях було незаконним, і стверджує, що стартап порушив угоду користувача Reddit.
Позов Reddit робить його першою великою технологічною компанією, яка юридично оскаржила дії постачальника моделей штучного інтелекту щодо використання його навчальних даних, приєднавшись до безлічі видавництв, які подали позови проти технологічних компаній на подібних підставах.
The New York Times подала до суду на OpenAI і Microsoft за те, що вони безоплатно і без дозволу використовували навчальні дані в своїх новинних статтях. Тим часом Сара Сільверман та інші автори книг подали до суду на компанію Meta за те, що вона без дозволу навчала ШІ-моделі на їхніх книгах. Музичні видавці та артисти також подали аналогічні позови проти стартапів, що генерують аудіо, відео та зображення зі штучним інтелектом, звинувачуючи їх у неправомірному використанні їхнього контенту.
“Ми не будемо миритися з тим, що такі жадібні до прибутку компанії, як Anthropic, комерційно використовують контент Reddit на мільярди доларів без жодної віддачі для редакторів або поваги до їхньої приватності”, – сказав Бен Лі, головний юридичний директор Reddit, у своїй заяві для TechCrunch.
Варто зазначити, що Reddit уклав угоди з іншими постачальниками ШІ-моделей, зокрема OpenAI та Google, які дозволяють цим компаніям тренувати ШІ-моделі на даних Reddit, а публікації сайту з’являються у відповідях їхніх ШІ-чат-ботів. Однак у своїй заяві Reddit зазначає, що підпорядковує OpenAI та Google певним умовам, які захищають інтереси та конфіденційність своїх користувачів.
Сем Альтман, генеральний директор OpenAI, володіє 8,7% акцій Reddit, що робить його третім за величиною акціонером, і колись був членом ради директорів компанії.
У своїй заяві Reddit стверджує, що звернувся до Anthropic і дав зрозуміти, що стартап не має дозволу на вилучення або використання контенту Reddit. Однак Reddit стверджує, що Anthropic “відмовився співпрацювати”.
“Ми не згодні з претензіями Reddit і будемо рішуче захищатися”, – заявила прес-секретар Anthropic Даніель Гіглієрі в електронному листі до TechCrunch.
У своїй скарзі Reddit стверджує, що боти Anthropic проігнорували файли robots.txt соціальної мережі – стандарт, який сигналізує автоматизованим системам не сканувати веб-сайти. Платформа онлайн-спільнот стверджує, що після того, як у 2024 році Anthropic заявила про заборону своїм ботам сканувати Reddit, боти Anthropic продовжували сканувати платформу понад 100 000 разів.
Reddit вимагає від Anthropic відшкодування збитків, а також відшкодування суми, на яку Anthropic збагатився за рахунок скрапінгу контенту Reddit. Reddit також вимагає судової заборони, яка забороняє Anthropic продовжувати використовувати контент Reddit.