OpenAI запускає універсальний агент у ChatGPT

OpenAI запускає нового агента ШІ загального призначення в ChatGPT, який, за словами компанії, може виконувати широкий спектр комп’ютерних завдань від імені користувачів. OpenAI заявляє, що агент може автоматично переміщатися в календарі користувача, створювати презентації та слайд-шоу, які можна редагувати, а також запускати код.

Інструмент, який отримав назву ChatGPT agent, поєднує в собі кілька можливостей з попередніх агентних інструментів OpenAI, в тому числі здатність оператора переходити по веб-сайтах, а також здатність Deep Research синтезувати інформацію з десятків веб-сайтів у стислий дослідницький звіт. OpenAI заявляє, що користувачі зможуть взаємодіяти з агентом, просто запитуючи ChatGPT природною мовою.

Агент ChatGPT буде доступний у четвер для передплатників тарифних планів OpenAI Pro, Plus і Team. Щоб активувати інструмент, користувачі можуть вибрати “режим агента” у випадаючому меню інструментів ChatGPT.

Запуск агента ChatGPT є найсміливішою спробою OpenAI перетворити ChatGPT на агентський продукт, який може виконувати дії і розвантажувати завдання для користувачів, а не просто відповідати на запитання. За останні роки компанії Кремнієвої долини, включаючи OpenAI, Google і Perplexity, представили десятки ШІ-агентів, які обіцяли зробити саме це. Однак ці ранні версії ШІ-агентів довели, що їм важко справлятися зі складними завданнями, і вони здаються менш привабливими як продукти, ніж ті, про які говорять керівники технологічних компаній, що розробляють ШІ-агентів.

Тим не менш, OpenAI стверджує, що агент ChatGPT набагато більш потужний, ніж його попередні пропозиції.

Новий агент компанії має доступ до роз’ємів ChatGPT, що дозволяє користувачам підключати такі додатки, як Gmail і GitHub, щоб агент міг знаходити релевантну інформацію для ваших підказок. OpenAI стверджує, що агент ChatGPT має доступ до терміналу і може використовувати API для доступу до певних додатків.

OpenAI припускає, що користувачі можуть за допомогою агента ChatGPT “спланувати і купити інгредієнти для приготування японського сніданку на чотирьох”, а також “проаналізувати трьох конкурентів і створити слайд-шоу”. Такі можливості вимагають від агента ChatGPT аналізу веб-сайтів, планування курсу дій та використання інструментів – набагато складніші завдання, ніж ті, які OpenAI раніше намагався вирішити за допомогою агентів.

Модель, що лежить в основі агента ChatGPT, пропонує найсучаснішу продуктивність за кількома бенчмарками, згідно з даними OpenAI.

Компанія заявляє, що модель агента ChatGPT набрала 41,6% на останньому іспиті людства (pass@1) – складному тесті, що складається з тисяч запитань з більш ніж ста предметів. Це приблизно вдвічі більше, ніж набрали на цьому тесті o3 і o4-mini від OpenAI.

На FrontierMath, одному з найскладніших відомих математичних тестів, OpenAI каже, що агент ChatGPT набрав 27,4%, коли у нього є доступ до інструментів, таких як термінал для виконання коду. Попередній найсучасніший результат походить від o4-mini, який набрав лише 6,3%.

OpenAI зазначає, що розробляла агента ChatGPT з думкою про безпеку, в основному тому, що продукт має деякі нові можливості, які можуть зробити його більш небезпечним в руках зловмисника. Раніше OpenAI вже попереджала, що агентні моделі можуть мати більш небезпечні можливості.

У звіті про безпеку агента ChatGPT OpenAI зазначає, що визначила цю модель як “високопотужну” в галузі біологічної та хімічної зброї, що визначається в Рамках готовності OpenAI як модель, здатна “посилити існуючі шляхи заподіяння серйозної шкоди”. OpenAI зазначає, що не має прямих доказів цього, але вирішив застосувати запобіжний підхід і активувати нові засоби захисту, щоб зменшити ці ризики.

Нові заходи безпеки для агента ChatGPT включають монітор, який працює в режимі реального часу, коли користувачі взаємодіють з продуктом. OpenAI заявляє, що він запускає класифікатор для кожного запиту, введеного в агент ChatGPT, визначаючи, чи пов’язаний запит з біологією. Якщо так, OpenAI пропускає відповідь агента ChatGPT через другий монітор, який визначає, чи може контент бути використаний для створення біологічної загрози.

OpenAI також заявляє, що відключив функцію пам’яті ChatGPT для цього агента, щоб запобігти зловживанням. В інших частинах ChatGPT функція пам’яті OpenAI дозволяє чат-боту посилатися на інформацію з попередніх чатів користувачів. Однак OpenAI стверджує, що зловмисники можуть використовувати цю функцію в агенті ChatGPT для витоку конфіденційних даних за допомогою швидких ін’єкційних атак. Однак компанія заявляє, що може повернутися до додавання цієї функції в майбутньому.

Хоча ChatGPT агент звучить вражаюче, ще належить з’ясувати, наскільки він дійсно здатний в реальному світі. До цього часу технологія агентів виявилася відносно крихкою при взаємодії з реальним світом. Тим не менш, OpenAI заявляє, що розробила більш ефективну модель, яка здатна виконати обіцянки ШІ-агентів.

Джерело

← Попередня стаття

Google анонсувала презентацію Pixel 10 і Pixel Watch 4 — захід відбудеться 20 серпня

Наступна стаття →

Винесли все цінне: дім Софії Ротару в Криму пограбували