Loqal – новинний агрегатор Loqal
Новини

Google Gemini AI створює ілюстровані історії: нові можливості

Google Gemini AI створює ілюстровані історії: нові можливості
HiTech.Expert • 1 хв читання

Коротко

Google Gemini AI отримав нову функцію "Книга історій", яка дозволяє створювати ілюстровані казки за текстовим описом. Користувачі можуть налаштовувати стиль ілюстрацій та навіть використовувати власні фотографії. Проте, при генерації зображень виникають непередбачувані дивацтва, такі як людські руки на рибках або невідповідні сцени.

Компанія Google запустила новий інструмент у своєму чат-боті Gemini AI, який дозволяє створювати ілюстровані історії, просто описуючи їх. Функція під назвою “Книга історій” генерує 10-сторінкові історії, кожна з яких містить короткий абзац тексту, який Gemini може прочитати вголос разом із супровідною ілюстрацією.

Ви можете налаштувати свою історію, попросивши Gemini використовувати певні художні стилі, наприклад, натхненні ліпленням з глини, аніме, коміксами тощо. Google також дозволяє завантажувати фотографії та інші зображення для Близнюків, наприклад, завантажити дитячий малюнок і попросити Близнюків створити історію про нього.

Мені просто необхідно було випробувати ці функції на собі, тому я попросив Близнюків створити історію про сома, який намагається завести друзів у новому акваріумі. Гортаючи “сторінки”, я виявив, що згенерований ним сюжет про мешканців акваріума, які намагаються зрушити з місця мармуровий камінчик, був досить кульгавим. Але в іншому все виглядало досить стандартно для дитячої історії, створеної штучним інтелектом, аж поки я не натрапив на ілюстрацію, на якій на одну з рибок була покладена людська рука.

В іншій історії, згенерованій Близнюками, сторінка із зображенням соусу для спагетті виглядала як місце злочину в мультфільмі, а зображення матері та сина, які дивляться телевізор, було перевернуте екраном догори дном. Мій колега Ендрю Лішевський (Andrew Liszewski) навіть помітив згенерований ШІ дивацтво у власному відеоролику Google про цю функцію, де жінка будує космічний корабель і видає звуки “тап, тап, тап”, тримаючи в руках гайковий ключ і якийсь інший інструмент, який я не можу розгледіти.

Окрім деяких невідповідностей у дизайні персонажів, я не помітив жодних інших кричущих дивацтв штучного інтелекту в інших історіях, які я попросив Gemini створити. Однак чат-бот, схоже, не розділив мого художнього бачення, коли я завантажив зображення намальованого мною мультяшного кота.