Loqal – новинний агрегатор Loqal
Наука і технології

MacWhisper навчилося перетворювати розмови в текст за кілька секунд

MacWhisper навчилося перетворювати розмови в текст за кілька секунд
Double.news • 0 переглядів • 1 хв читання

Програма MacWhisper, відома як один із найзручніших способів транскрипції аудіо на комп’ютерах Mac, отримала потужне оновлення. Тепер вона підтримує Parakeet — надшвидку модель штучного інтелекту від Nvidia, яка здатна обробляти до 60 хвилин аудіо всього за одну секунду (за наявності відповідного графічного процесора). Про це пише 9to5Mac.

Parakeet — це новітня модель автоматичного розпізнавання мовлення від Nvidia, представлена у травні 2025 року. Вона обіцяє феноменальну швидкість транскрипції, зокрема при використанні таких GPU як A100, H100, T4 або V100.

До цього часу Parakeet була доступна переважно через open-source інструменти, що вимагали командного рядка та налаштувань вручну. Проте з виходом оновлення MacWhisper 1.3 цю технологію інтегровано у зручний інтерфейс для користувачів macOS.

Завдяки співпраці з командою Argmax, MacWhisper тепер надає змогу Pro-користувачам використовувати Parakeet напряму в застосунку. За словами розробника Жорді Бруїна, результат — справді вражаючий:

«MacWhisper тепер підтримує модель Parakeet. Ми змогли транскрибувати 30-хвилинний подкаст менше ніж за 8 секунд», — зазначив Бруїн.

У тесті на MacBook Pro з чіпом M2 Pro застосунок обробив 3-годинний випуск подкасту за 1 хвилину 22 секунди, включаючи розпізнавання мовців.

Parakeet проти Whisper: технологічна еволюція

Whisper — серія моделей OpenAI, яка стала проривом у транскрипції у 2022–2023 роках, — поступово відходить у минуле. Зосередившись на GPT‑4o та нових комерційних напрямках, OpenAI припинила розвиток Whisper, відкривши простір для нових гравців.

Parakeet — яскравий приклад цієї нової хвилі. Її продуктивність перевершує попередні моделі і дає змогу здійснювати транскрипцію у режимі, близькому до реального часу.

На момент запуску Parakeet у MacWhisper підтримує лише англійську мову. Проте розробники обіцяють багатомовну версію найближчим часом.

Також слід враховувати, що функціональність доступна лише у платній версії MacWhisper Pro.

0