11 явних ознак, що зображення створено штучним інтелектом: розпізнаємо ШІ-ілюзії

Які ознаки вказують на те, що зображення створив ШІ

Сучасний штучний інтелект (ШІ) досяг неймовірних висот у створенні зображень. Сьогодні він здатен генерувати настільки реалістичні світлини, що подекуди їх майже неможливо відрізнити від справжніх фотографій. Проте, незважаючи на разючі успіхи, нейромережі все ще мають певні «ахіллесові п’яти» — характерні помилки та невідповідності, які можуть видати їхню роботу.

Експерти зібрали одинадцять явних ознак, за якими можна визначити, що перед вами не живе фото, а високотехнологічне творіння штучного інтелекту.

«Мертві» або спотворені очі. Очі є дзеркалом душі, але для ШІ вони залишаються складним елементом. Якщо ви відчуваєте неясне відчуття дискомфорту, дивлячись на портрет, часто виною тому — очі. Погляд на таких зображеннях може здаватися порожнім, асиметричним, позбавленим природної глибини чи емоцій. Зіниці можуть бути зміщені, райдужні оболонки — різних розмірів, а вираз обличчя — млявим і неживим.

Спотворені логотипи та брендинг. Одним з найпомітніших маркерів того, що зображення згенероване штучним інтелектом, є неточний брендинг. Нейромережі дуже рідко відтворюють логотипи чи написи брендів бездоганно. Ви часто побачите, як знайомий вам логотип — наприклад, Nike — виглядає деформованим, розтягнутим, або навіть дивним чином поєднаним з елементами іншого бренду. Замість чіткого написання, можуть з’являтися випадкові символи, які лише здалеку нагадують літери чи емблеми, але насправді не існують.

ШІ не знає, що таке бренд чи його значення, а просто намагається імітувати візуальні патерни, на яких навчався. Саме тому дрібні деталі стають критичними: товщина шрифту може «плавати», інтервали між буквами будуть нерівномірними, а загальна форма об’єкта може виглядати «розпливчастою» або неправильною. Це особливо кидається в очі, коли ШІ намагається об’єднати декілька логотипів в одному зображенні.

Цікавий факт: під час тестування багатьох ШІ-генераторів помічено, що майже кожен з них схильний вставляти логотип Coca-Cola (або його дуже схожий варіант) у будь-яку сцену, де це логічно. Причому часто цей логотип відтворюється досить точно. Це наводить на думку, що саме цей бренд є одним з найчастіше запитуваних користувачами, і тому моделі ШІ були «навчені» генерувати його набагато краще, ніж логотипи інших компаній.

Неможливі відображення. Однією з найочевидніших і часто химерних ознак того, що зображення згенероване штучним інтелектом, є неправильне відображення у дзеркалах, воді чи склі. Ці відбиваючі поверхні є справжнім викликом для нейромереж. Ви можете помітити, що відображення повністю відсутні, або ж вони містять спотворені чи невідповідні елементи, які суперечать реальності. Наприклад, у дзеркалі може з’явитися зайва рука, якої немає в основному зображенні, або об’єкти можуть бути відображені там, де їх насправді бути не повинно. В особливо «креативних» випадках саме відображення може ніби «вийти з дзеркала» і стати частиною реального світу, створюючи ефект, наче ви дивитесь кадр із фільму жахів початку 2000-х.

Річ у тім, що реальний світ підпорядковується законам фізики та світла, а ШІ, на жаль, їх не «розуміє». Він просто намагається імітувати візуальні патерни. Тому, чим більше відбиваючих поверхонь присутньо на зображенні, тим вища ймовірність виявити ці невідповідності та зрозуміти, що перед вами — творіння штучного інтелекту.

Безглузда архітектура та нелогічні структури. Штучний інтелект може дивовижно точно імітувати архітектурні стилі, але коли справа доходить до логічної структури та інженерії, він часто «провалюється». Якщо уважно придивитися до будівель на згенерованих ШІ зображеннях, можна помітити безліч елементів дизайну, які не мають жодного практичного чи фізичного сенсу.

Сходи, що ведуть просто в стіни.

Дверні отвори, які висять у повітрі, без можливості до них дістатися.

Вікна, що виглядають стиснутими або розташовані дивно, ніби їх випадково скопіювали та вставили з інших будівель.

Дахи, які перетинаються під неможливими кутами.

Опорні колони, що зникають у повітрі або пронизують підлогу без будь-якої логіки.

Річ у тім, що ШІ не розуміє інженерних принципів чи законів гравітації. Він лише «здогадується», базуючись на візуальних шаблонах, які бачив під час навчання. В результаті він часто створює структури, які на перший погляд схожі на будівлі, але розсипаються при найближчому розгляді, виявляючи свою штучну природу.

Нелогічні та спотворені фони. Іноді зображення, створені штучним інтелектом, можуть здаватися цілком переконливими на перший погляд, особливо якщо зосередитися на передньому плані. Однак, якщо придивитися уважніше до фону, ви часто помітите дивні деталі, які свідчать про те, що фотографія несправжня.

Ось що може видати роботу ШІ на задньому плані:

Нелогічні елементи. Ви можете побачити дерево, що росте прямо з даху, або людей, які ледь помітно ширяють у повітрі. Знакові об’єкти, як-от Ейфелева вежа, можуть з’явитися в абсолютно невідповідних місцях, наприклад, посеред звичайного передмістя.

«Злиті» фігури. Люди або предмети можуть виглядати частково злитими з іншими об’єктами — будівлями, автомобілями чи парканами — створюючи враження візуальних «глюків».

Спотворений масштаб. Часто ШІ «промахується» з розмірами. Ви можете побачити кішку розміром з поштову скриньку або вуличний ліхтар, який ледь сягає рівня очей.

Незрозумілі плями та текстури. Іноді фон може містити невпізнавані, розмиті плями або дивні текстури, які, здається, замінюють справжні об’єкти, створюючи хаотичний вигляд, що не існує в реальному світі.

Штучний інтелект добре імітує окремі деталі, але він часто не розуміє, як ці деталі повинні логічно взаємодіяти та розміщуватися в просторі. Навіть найсучасніші генератори зображень, які створюють дуже фотореалістичні результати, все ще мають труднощі з відтворенням чистого й логічного фону. У підсумку виходить сцена, яка може здаватися правдоподібною, якщо дивитися не надто прискіпливо, але ретельний погляд швидко виявить її штучну природу.

Розмиті або спотворені фонові фігури. Ще однією поширеною ознакою згенерованих ШІ зображень є недосконале відтворення людей на задньому плані. Для штучного інтелекту ці фігури, як правило, мають низький пріоритет при обробці.

Через це вони часто виглядають розмитими, незавершеними або спотвореними у неможливі пози. Їхні риси обличчя можуть бути нечіткими або зовсім розпливчастими, а пози — дезорієнтуючими. Нерідко можна побачити, як кінцівки дивним чином перекриваються, або ж голови ніби зависають над шиєю без належного з’єднання. У групових сценах ШІ може створювати повторювані обличчя, дзеркальні зачіски або навіть людей, застиглих в ідентичних позах і одягнених у дивно схожий одяг.

Для штучного інтелекту ці фонові фігури слугують лише візуальним доповненням, але на ділі вони стають тривожними силуетами, які чітко вказують на штучне походження зображення. Незалежно від того, наскільки реалістичним може бути передній план, ці недоліки на задньому плані є яскравою ознакою того, що ви дивитеся не на справжню фотографію.

Важливо зазначити, що ці показники є більш характерними для старіших генераторів зображень на базі штучного інтелекту. Новіші та більш досконалі моделі нейромереж значно покращили якість відтворення фонових фігур, тому ці проблеми можуть вже не бути настільки очевидними.

Занадто гладка та «пластикова» шкіра. Однією з найпомітніших ознак зображень, створених штучним інтелектом, є неприродно гладка, «відретушована» шкіра у людей. Це відбувається через особливості обробки ШІ рис обличчя та текстур: він схильний надавати перевагу ідеальній гладкості, а не реалізму.

У таких зображеннях ви побачите, як зникають пори, розгладжуються зморшки, веснянки та шрами. У результаті обличчя виглядає восковим, надмірно відполірованим, повністю позбавленим природної текстури справжньої шкіри. Часто цей «згладжувальний» ефект поширюється не лише на обличчя, а й на шию, руки та навіть одяг, створюючи загальне відчуття дивної штучності.

Багато ШІ-генераторів, які створюють зображення з текстових запитів, стикаються саме з цією проблемою. Лише найновіші та найдосконаліші моделі, такі як GPT-4o, можуть створювати настільки реалістичні зображення, що уникають цього ефекту «пластикової» шкіри.

Аномалії у зображенні рук. Навіть сьогодні, попри значні успіхи в розвитку штучного інтелекту, руки залишаються однією з найочевидніших «слабких ланок» у згенерованих зображеннях. ШІ давно має проблеми з їхнім точним відображенням, і хоча помітні покращення вже є, спотворені пальці все ще часто видають його роботу.

Коли розглядаєте зображення, зверніть увагу на такі аномалії:

Зайві або відсутні пальці. Це найпоширеніша ознака.

Зрощені суглоби або пальці, що виглядають неприродно з’єднаними.

Неможливі вигини або пальці, що стирчать з несподіваних місць, наприклад, прямо з долонь.

Неправильні пропорції. Руки можуть здаватися занадто великими, занадто маленькими або розташованими під абсолютно неможливими кутами щодо тіла.

Особливо варто придивитися до великих пальців — вони часто є найбільш показовими. Якщо ви збільшите зображення, то, ймовірно, знайдете щось дивне у їхній формі чи положенні. Це відбувається тому, що штучний інтелект насправді не «розуміє» анатомію людини; він лише намагається імітувати візуальні шаблони, що часто призводить до незграбного та анатомічно некоректного вигляду.

«Розпливчастий» або безглуздий текст. Якщо ви бачите на зображенні, створеному штучним інтелектом, написи, які важко прочитати або здаються безглуздими, це майже стовідсотково вказує на роботу нейромережі. ШІ постійно «провалюється» у відтворенні тексту.

Попросіть його згенерувати вуличний знак, етикетку на товарі чи будь-який інший напис, і ви часто отримаєте переплутані, нечитабельні символи, що нагадують безладну гру в «Ерудит».

Причина цього проста: моделі ШІ навчаються на візуальних даних, а не на розумінні мови. Через це вони створюють лише літероподібні фігури, які імітують текст, але не утворюють справжніх, осмислених слів. Навіть якщо на перший погляд здається, що слово впізнаване, при детальнішому розгляді ви, скоріш за все, виявите:

Нелогічні пробіли між символами.

Хоча деякі просунуті моделі вже здатні генерувати розбірливий текст (наприклад, GPT-4o може створювати неймовірно реалістичні зображення клавіатури, хоча іноді з випадковими символами), навіть у них можуть траплятися незначні невідповідності. Існують інструменти, які допомагають виправити незрозумілий текст на ШІ-зображеннях, але їхня ефективність варіюється.

Неузгоджені джерела світла та тіні. Ще один частий «тривожний сигнал», який вказує на зображення, створене штучним інтелектом, — це помилки в освітленні. На таких фотографіях ви можете помітити дивні аномалії з тінями та джерелами світла.

Наприклад, тіні можуть бути спрямовані в протилежні сторони, що фізично неможливо при одному джерелі світла. Або ж ви побачите людину, яка освітлена зліва, але відкидає тінь у тому ж, лівому напрямку. Самі тіні можуть виглядати неприродно: занадто м’якими, надмірно різкими або взагалі відсутніми там, де вони мали б бути.

Хоча більшість із нас не є експертами з освітлення, у кожного є інтуїтивне розуміння того, як поводиться світло в реальному світі. Коли штучний інтелект не дотримується цих базових фізичних правил, це одразу кидається в око, навіть якщо ми усвідомлюємо це лише підсвідомо.

Прикраси, що кидають виклик фізиці. Штучний інтелект часто має значні проблеми з правильним відтворенням того, як аксесуари взаємодіють з людським тілом. У згенерованих ШІ зображеннях ви можете помітити дивні аномалії: сережки, що зависають у повітрі, не торкаючись вух; намиста, які, здається, «вбудовані» прямо в шкіру або дивно виступають з неї; окуляри, що ширяють над вухами або нерівно сидять на обличчі. Якщо ви збільшите такі ділянки, то часто побачите, що аксесуари просто не виглядають реалістично. Наприклад, довге намисто може звисати низько на грудях, але повністю бути відсутнім навколо шиї. Тіні, що відкидаються цими об’єктами, також можуть бути відсутніми або суперечити основному джерелу світла, що додає ще один шар візуальних помилок. Ці деталі є чіткою ознакою того, що зображення не є справжньою фотографією.

Наступного разу, коли ви побачите неймовірно реалістичне зображення в інтернеті, не поспішайте ділитися ним. Зробіть паузу і уважно придивіться. Збільште масштаб, порахуйте пальці, спробуйте прочитати написи на дорожніх знаках, перевірте, чи логічно розташовані тіні. Всі ці, здавалося б, дрібні підказки можуть багато чого розповісти.

Навіть якщо штучний інтелект точно відтворив деякі деталі, він часто «провалюється» в інших місцях. Чим уважніший ваш погляд, тим більше невідповідностей ви знайдете. Хоча ШІ стрімко розвивається та вдосконалюється, він поки що не може відтворити реальність з абсолютною точністю. Принаймні, не зараз.\

644