Claude Sonnet 4.5 — найбезпечніша модель ШІ від Anthropic

У травні компанія Anthropic анонсувала дві нові системи штучного інтелекту — Opus 4 і Sonnet 4. Зараз, менш ніж через півроку, компанія представляє Sonnet 4.5 і називає її найкращою на сьогоднішній день моделлю кодування у світі. Anthropic обґрунтовує це твердження низкою тестів, в яких новий ШІ перевершує не тільки свого попередника, але й дорожчий Opus 4.1 та системи-конкуренти, зокрема Gemini 2.5 Pro від Google та GPT-5 від OpenAI. Наприклад, в OSWorld, наборі тестів, що перевіряє моделі ШІ на реальних комп’ютерних завданнях, Sonnet 4.5 встановив рекордний результат у 61,4%, що на 17 процентних пунктів вище за Opus 4.1.

Водночас нова модель здатна самостійно працювати над багатоетапними проектами протягом понад 30 годин, що є значним поліпшенням порівняно з приблизно сімома годинами, які Opus 4 міг підтримувати під час запуску. Це важлива віха для типу агентних систем, які Anthropic хоче створити.

Можливо, ще важливіше те, що компанія стверджує, що Sonnet 4.5 є найбезпечнішою системою штучного інтелекту на сьогоднішній день, оскільки модель пройшла «всебічну» підготовку з питань безпеки. Ця підготовка перетворює чат-бота, за словами Anthropic, на «значно» менш схильного до «підлещування, обману, прагнення влади та схильності до маревного мислення» — всіх потенційних рис моделі, які останніми місяцями поставили OpenAI в скрутне становище. Водночас Anthropic посилила захист Sonnet 4.5 від атак типу «prompt injection». З огляду на складність нової моделі, Anthropic випускає Sonnet 4.5 у рамках своєї системи безпеки штучного інтелекту рівня 3, що означає, що вона оснащена фільтрами, призначеними для запобігання потенційно небезпечним результатам, пов’язаним із підказками щодо хімічної, біологічної та ядерної зброї.

Сьогоднішнім оголошенням Anthropic також впроваджує поліпшення якості життя у всьому наборі продуктів Claude. По-перше, Claude Code, популярний агент кодування компанії, має оновлений інтерфейс терміналу з новою функцією під назвою «контрольні точки». Як ви, мабуть, здогадуєтеся з назви, вони дозволяють зберігати ваш прогрес і повертатися до попереднього стану, якщо Claude пише якийсь дивний код, який не працює так, як ви собі уявляли. Створення файлів, яке Anthropic почала впроваджувати на початку місяця, тепер доступне для всіх користувачів Pro, а якщо ви приєдналися до списку очікування Claude для Chrome, ви можете почати користуватися розширенням вже сьогодні.

Ціна API для Sonnet 4.5 залишається на рівні 3 долари за мільйон вхідних токенів і 15 доларів за таку ж кількість вихідних токенів. Випуск Sonnet 4.5 завершує успішний вересень для Anthropic. Всього через день після того, як Microsoft додала моделі Claude до Copilot 365 минулого тижня, OpenAI визнала, що її конкурент пропонує найкращий штучний інтелект для виконання робочих завдань.

Джерело

← Попередня стаття

PlayStation представляє небачені дизайнерські концепти

Наступна стаття →

Львівські лікарі врятували передчасно народжену дівчинку без частини стравоходу