Spotify готує «балакучий» голосовий інтерфейс на базі штучного інтелекту

Spotify анонсував подальший розвиток інтерактивного голосового інтерфейсу, який базуватиметься на нових досягненнях генеративного ШІ. Під час оголошення фінансових результатів за другий квартал представники компанії заявили: взаємодія з платформою стане ще більш розмовною, персоналізованою і контекстною. Про це повідомляє TechCrunch.

Як пояснив головний директор з продуктів та технологій Spotify Густав Седерстрем, нова хвиля розвитку пов’язана з голосовим ШІ-діджеєм, який з травня 2025 року доступний англомовним преміум-користувачам. Система дає змогу змінювати музику, настрій чи жанр за допомогою голосу — просто натиснувши кнопку в додатку.

Завдяки цій функції компанія отримує новий масив даних, який дає змогу зіставляти фрази користувачів із конкретними піснями чи діями. На відміну від традиційних алгоритмів, побудованих лише на переходах між треками, голосові запити відкривають глибше розуміння вподобань слухачів.

«Це абсолютно новий і дуже цінний набір даних для нас», — зазначив Седерстрем.

Наступним кроком стане впровадження ШІ-моделей із функціями «reasoning» — тобто здатністю до логічного аналізу. Такий підхід дозволить не лише передбачати, яку пісню захоче слухати користувач, а й враховувати його історію прослуховувань, попередні голосові запити та контекст.

«Ви вже можете писати Spotify, говорити з ним. І ця взаємодія тільки розширюватиметься», — пообіцяв топменеджер компанії.

Окрім клієнтських функцій, Spotify також використовує генеративний ШІ для створення прототипів продуктів і підвищення ефективності внутрішніх процесів, зокрема у сфері фінансів.