Google розширює можливості свого ШІ-сервісу Gemini, додаючи підтримку перетворення фотографій на відео за допомогою моделі Veo 3. Ця функція, яка раніше була доступна лише через платформу Flow для кінематографістів, тепер з’явилася у відкритому доступі через мобільний додаток і вебінтерфейс Gemini. Про це пише ArsTechnica.
Veo 3 — це модель штучного інтелекту, яка створює реалістичні відео на основі текстового опису. Вона здатна додавати музику, озвучення, діалоги та звукове оформлення. Нове оновлення дозволяє завантажити фотографію, вказати бажану сцену або сюжет, і отримати відео довжиною до 8 секунд.
Щоб скористатися функцією, потрібно вибрати вкладку “Video” у меню Gemini, додати зображення та текстовий запит. Рендеринг триває кілька хвилин через високі обчислювальні вимоги.
Функція генерації відео з фотографій у Gemini має низку обмежень. Відео створюються в роздільній здатності 720p і можуть тривати до 8 секунд. Користувачі тарифного плану AI Pro, який коштує $20 на місяць, отримують доступ до трьох генерацій відео щодня. Для передплатників AI Ultra, що платять $250 на місяць, ліміт збільшується до п’яти відео на день. Ця функція доступна виключно для платних користувачів Gemini, тоді як користувачі безкоштовного плану не мають до неї доступу.
Google заявляє, що дотримується політики безпеки: усі відео маркуються водяним знаком SynthID, що ідентифікує їх як створені ШІ. Компанія також впроваджує методику red teaming, щоб тестувати систему на потенційні зловживання та запобігати створенню небезпечного контенту.