Коротко
Reddit обмежив доступ Wayback Machine до своїх даних через порушення правил збору інформації для штучного інтелекту. Це призвело до того, що індексація включатиме лише головну сторінку Reddit, а не повний вміст публікацій та коментарів. Reddit вимагає гарантій щодо дотримання конфіденційності користувачів, щоб відновити повний доступ.
Reddit оголосив про суттєві обмеження для Wayback Machine — інструмента архівування вебсайтів від Internet Archive. Причина — виявлені випадки, коли AI-компанії масово копіювали дані Reddit з архіву, порушуючи політику платформи, повідомляє The Verge.
Згідно з новими правилами, Wayback Machine більше не зможе індексувати, сторінки з повним вмістом публікацій, коментарі та профілі користувачів.
Доступ залишиться лише до головної сторінки Reddit.com, яка відображатиме популярні теми та заголовки за певний день.
Представник Reddit Тім Ратшмідт у коментарі The Verge пояснив:
«Internet Archive надає цінний сервіс для відкритого вебу, але ми стали свідками випадків, коли AI-компанії порушували правила платформи, зокрема наші, і збирали дані з Wayback Machine».
Reddit вважає, що архівування не повинно включати контент, який може порушувати конфіденційність користувачів або зберігати видалені матеріали. Платформа повідомила Internet Archive про зміни заздалегідь і готова відновити повний доступ, якщо архів гарантуватиме дотримання правил.