Reddit звинувачує Anthropic в незаконному використанні даних

Загальновідомо, що індустрія штучного інтелекту ґрунтується на хиткому правовому полі. Такі компанії, як OpenAI, побудували свій багатомільярдний бізнес на величезних обсягах навчальних даних, значна частина яких походить із захищеного авторським правом контенту. Творці цього контенту знають, що їх обкрадають, і це все частіше призводить до судових позовів. Цього тижня ми отримали ще одне нагадування про цю загадку, коли Reddit подав до суду на Anthropic за використання дописів редакторів у своїх навчальних даних.

Позов Reddit, поданий у середу, звинувачує компанію Anthropic, яка займається розробкою штучного інтелекту за підтримки Amazon, у порушенні користувацької угоди. “Ще в грудні 2021 року… Anthropic без дозволу та з прямим порушенням користувацької угоди Reddit навчала Клода відповідати на пости користувачів Reddit”, – йдеться в позові.

Anthropic, чиїм флагманським продуктом є чат-бот Claude, намагається позиціонувати себе як “хорошого хлопця” в індустрії ШІ – компанію, яка грає за правилами і просуває фреймворки ШІ, що враховують міркування безпеки та етики. Але, незважаючи на свій піар “білого лицаря”, компанія неодноразово стикалася з юридичними проблемами, які ставлять під сумнів її нібито “етичну” бізнес-практику. Судовий процес, що відбувся цього тижня, є черговим нагадуванням про це.

Позов звинувачує Anthropic у несправедливому збагаченні, а також у порушенні користувацької угоди платформи. У позові стверджується, що боти АІ-компанії відвідали її сайт понад 100 000 разів з 2024 року.

“У цій справі йдеться про два обличчя Anthropic: публічне, яке намагається втертися у свідомість споживача з претензіями на праведність і повагу до кордонів і закону, і приватне, яке ігнорує будь-які правила, що перешкоджають його спробам ще більше набити кишені”, – йдеться в судовому позові. У ньому додається, що Anthropic “продовжує публічно визнавати, що тренує свої технології штучного інтелекту на контенті Reddit”.

Коли Gizmodo звернувся за коментарем, представник Anthropic надав наступну заяву: “Ми не згодні з претензіями Reddit і будемо енергійно захищатися”.

Війна за використання контенту зі штучним інтелектом стала однією з найпомітніших дилем індустрії. Платформи та автори усвідомлюють, що їхній контент крадуть заради палива для ШІ, і вони запускають судову машину, щоб дати відсіч. На даний момент проти OpenAI подали позови так багато різних людей та установ, що важко відстежити їх усі – від Сари Сільверман, Та-Нахісі Коутс, Джорджа Р. Р. Мартіна та Джонатана Франзена до Центру журналістських розслідувань, The Intercept, різноманітних газет (включаючи The Denver Post та Chicago Tribune) та деяких ютуберів. Наразі The New York Times судиться з компанією на аналогічних підставах.

Reddit намагається убезпечити себе від обкрадання, розробляючи контракти з компаніями, що займаються розробкою ШІ, в яких чітко прописано обмін контенту на гроші. У лютому минулого року Reddit уклав угоду з Google, яка дозволила технологічному гіганту використовувати контент на його платформі як корм для ШІ за умови, що компанія буде платити 60 мільйонів доларів на рік. Незабаром після цього аналогічну угоду було укладено з OpenAI. Здається, Anthropic не отримав повідомлення про це, але тепер точно отримає. Все більше і більше здається, що це нова модель для індустрії штучного інтелекту: Цитуючи одне з моїх улюблених телешоу, вам доведеться платити податок на тролів, якщо ви не хочете, щоб на вас подали в суд. Очевидно, що така ситуація вигідна великим компаніям. ШІ-компанії з достатніми ресурсами зможуть купувати доступ до великих обсягів даних, щоб підживлювати свої ШІ-звички. Меншим компаніям з меншими ресурсами не пощастить.

1267