OpenAI представила нового універсального ШІ-агента для ChatGPT, здатного самостійно виконувати різноманітні комп’ютерні завдання від імені користувача.
Як зазначає компанія, новий агент може автоматично управляти календарем, створювати та редагувати презентації, запускати програмний код тощо.
Новий інструмент ChatGPT agent об’єднує можливості кількох попередніх агентних систем, взаємодію з вебсайтами за допомогою кліків, також у нього є функціонал Deep Research для збору інформації з численних джерел і підготовки стислих аналітичних звітів.
Керування агентом здійснюється в діалозі звичайною мовою. Наразі функція доступна для користувачів із тарифами Pro, Plus і Team. Для активації потрібно перейти в меню ChatGPT і обрати режим агента (agent mode).
Інструмент також підтримує інтеграції через ChatGPT connectors, зокрема, з Gmail, GitHub та іншими сервісами, а також має доступ до терміналу та API.
Результати тестування
Агентна модель, яка є основою цього інструменту, продемонструвала високі результати в низці тестів. У складному тесті Humanity’s Last Exam, що включає тисячі запитань зі 100+ дисциплін, агент набрав 41,6% — у два рази більше, ніж моделі o3 та o4-mini.
У тесті FrontierMath, який перевіряє складні математичні навички, ChatGPT agent показав результат 27,4%, тоді як попередній рекорд – лише 6,3% (o4-mini).
Фокус на безпеку
З огляду на розширений функціонал, OpenAI підкреслює важливість безпеки нового агента, оскільки потенційно він може бути використаний у шкідливих цілях.
У звіті зазначено, що модель має високий рівень знань у сферах біологічної та хімічної зброї. Прямих ознак загрози немає, проте компанія впровадила низку запобіжних заходів:
- онлайн-моніторинг – усі запити проходять перевірку на біологічну тематику. За потреби відповіді додатково аналізуються на ризики;
- вимкнення функції памʼяті – для захисту від потенційного витоку інформації через шкідливі промпти.
Нагадаємо, що ще в липні OpenAI повідомила про підвищення рівня безпеки своїх систем на тлі зростання загроз корпоративного шпигунства, зокрема з боку китайських компаній.