OpenAI випустила нову модель штучного інтелекту — o3-pro. Компанія називає її своєю найпотужнішою моделлю. Це оновлена версія моделі o3, яка спеціалізується на логічному мисленні. На відміну від традиційних моделей ШІ, такі моделі розв’язують задачі поетапно, що робить їх ефективнішими у сферах, де потрібне точне міркування — зокрема в математиці, фізиці та програмуванні.
In expert evaluations, reviewers consistently prefer OpenAI o3-pro over o3, highlighting its improved performance in key domains—including science, education, programming, data analysis, and writing.Reviewers also rated o3-pro consistently higher for clarity, comprehensiveness,… pic.twitter.com/VjVQSmcwyq
о3-pro доступна для користувачів ChatGPT Pro і Team, де замінює попередню модель o1-pro. Користувачі версій Enterprise та Edu отримають доступ до нової моделі на наступному тижні. Крім того, модель вже доступна для розробників через API. Ціна використання: $20 за мільйон вхідних токенів і $80 за мільйон вихідних. Один мільйон вхідних токенів приблизно дорівнює 750 тисячам слів.
За словами OpenAI, o3-pro суттєво перевершує модель o3 в усіх протестованих категоріях, особливо в таких галузях, як наука, освіта, бізнес, програмування та написання текстів. Експерти також високо оцінили її здатність дотримуватись інструкцій, чіткість, повноту відповідей і точність.
OpenAI o3-pro is available in the model picker for Pro and Team users starting today, replacing OpenAI o1-pro.Enterprise and Edu users will get access the week after.As o3-pro uses the same underlying model as o3, full safety details can be found in the o3 system card.…
о3-pro може використовувати інструменти, такі як вебпошук, аналіз файлів, Python, робота з зображеннями та персоналізована пам’ять. Проте модель працює повільніше, ніж o1-pro, і має кілька обмежень: тимчасові чати в ChatGPT наразі недоступні, модель не створює зображення і не підтримує функцію Canvas.
Попри ці недоліки, о3-pro показала високі результати в бенчмарках. На математичному тесті AIME 2024 вона обійшла найкращу модель Google — Gemini 2.5 Pro, а в науковому тесті GPQA Diamond перевершила Claude 4 Opus від Anthropic.
OpenAI позиціонує o3-pro як новий стандарт для завдань, що потребують високого рівня розуміння та точності.