Loqal – новинний агрегатор Loqal
Політика

Не вірте очам і вухам. Як розпізнати фейкові фото, відео та аудіо, створені за допомогою ШІ

Не вірте очам і вухам. Як розпізнати фейкові фото, відео та аудіо, створені за допомогою ШІ
РБК-Україна • 4 переглядів • 1 хв читання

Бум штучного інтелекту дав світові не тільки чат-ботів, а й новий вид цифрових фальсифікацій - діпфейки. Це технології, які дають змогу створювати вкрай правд оподібні фальшиві фото, відео та аудіозаписи.

РБК-Україна розповідає, як не попастися на фейкові фото, відео та аудіо, з посиланням на технологічний сайт PCWorld.

Термін deepfake походить від поєднання слів deep learning (глибоке навчання) і fake (підробка). Це може бути, наприклад, відео, де обличчя однієї людини замінено на обличчя іншої, або аудіо, де "відомий голос" говорить те, чого ніколи не вимовляв.

Раніше на створення таких фейків були потрібні ресурси і навички. Тепер же завдяки доступності АІ-сервісів, навіть онлайн, створити діпфейк може практично будь-який користувач.

Творці таких додатків часто позиціонують їх як розважальні. Але на практиці вони все частіше використовуються шахраями:

У перші роки розпізнати фейк можна було за візуальними і звуковими огріхами: дивна міміка, неприродна інтонація. Але технології розвиваються, і зараз відрізнити підробку стає дедалі важче.

Сьогодні в інтернеті доступні спеціальні АІ-сервіси, які аналізують зображення і відео. Один із найбільш просунутих - Deepfake-o-Meter, розроблений лабораторією медіакриміналістики Університету Буффало (США).

Він об'єднує 16 АІ-систем, які перевіряють завантажені користувачем фото, відео або аудіо та видають імовірність підробки. Доступ до сервісу безкоштовний - після реєстрації ви отримуєте 30 перевірок.

Наприклад, знамените фото Папи Римського Франциска в білому пуховику, створене за допомогою Midjourney, тільки дві системи розпізнали як діпфейк з імовірністю понад 50%. А ось портрет, згенерований Canva, було визначено як ШІ-зображення в 7 випадках із 16.

На зображенні Папи тінь не збігається з оправою окулярів, а хрестик на ланцюжку висить тільки з одного боку (фото: Reddit)

Сервіс Sightengine (Франція) працює швидше і дав 99% ймовірності фейку для зображення жінки, згенерованого ШІ. Однак щодо фото з Папою - лише 53%.

Жодна з програм розпізнавання, що використовуються в Deepfake-o-Meter, не визначила зображення Папи Франциска в білому пуховику як достовірний діпфейк (фото: IDG)

Навіть без спеціальних програм підробку можна розпізнати - достатньо уважно придивитися:

З появою відеогенератора Sora від OpenAI у 2024 році діпфейки вийшли на новий рівень. Сотні реалістичних роликів, створених цією системою, вже можна знайти на YouTube. За якістю вони часом не поступаються професійній зйомці.

Розпізнати такі відео дедалі складніше, проте безкоштовні онлайн-інструменти все ще існують. Один із них - Deepware.ai, інший - Hive AI Detector. Перший повністю безкоштовний, другий дає змогу перевіряти відео тривалістю до 20 секунд у безкоштовній версії.

Під час тестування роликів, згенерованих за допомогою Sora, Deepware показав себе слабко - не розпізнав жодного фейку. Натомість Hive спрацював значно краще: у всіх випадках програма вказала ймовірність діпфейку 99%.

Навіть без спеціальних програм деякі ознаки видають підроблене відео:

Щоб помітити багато з цих деталей, іноді достатньо сповільнити відео.

ШІ тепер здатний імітувати голос людини всього за кількома секундами запису. Програма на кшталт Real Time Voice Cloning може озвучити будь-який текст голосом іншої людини.

Технологія ще не ідеальна - за дослідженнями, у двох із трьох випадків люди можуть розпізнати фальшивку. Але вже зараз злочинці успішно використовують діпфейк-голоси для "дзвінків від родичів" із проханнями про допомогу.

Інструменти для розпізнавання фейкових голосів

Поки що більшість рішень орієнтовані на англомовний ринок:

4