OpenAI анонсувала нові високопродуктивні моделі штучного інтелекту — o3 та o4-mini, які входять до серії “o”. Ці моделі відрізняються здатністю до більш глибокого аналізу перед формуванням відповіді, встановлюючи новий рівень якості та ефективності.
У пресрелізі від 16 квітня 2025 року OpenAI повідомила про значний прорив у можливостях міркування нових моделей, а також у їхній здатності інтегрувати інструменти без зовнішньої допомоги. Вперше моделі з серії “o” самостійно використовують усі функції ChatGPT: інтернет-пошук, аналіз файлів через Python, обробку зображень та генерацію візуального контенту.
Моделі вміють розпізнавати, коли та як застосовувати ці інструменти, щоб надати точні й комплексні відповіді упродовж хвилини, що значно підвищує ефективність у складних завданнях.
Характеристики моделей:
OpenAI o3 — найпотужніша модель у серії, яка демонструє виняткові результати в програмуванні, математиці, природничих науках і візуальних завданнях. Вона побила рекорди на платформах Codeforces, SWE-bench та MMMU. Модель особливо добре справляється зі складними завданнями, що потребують багатогранного аналізу, і показала на 20% менше серйозних помилок, ніж o1, зокрема у сфері бізнес-консалтингу, креативних проєктів і біотехнологій. Експерти також підкреслили її здатність формулювати й критично перевіряти нові ідеї.
OpenAI o4-mini — більш компактна модель, орієнтована на швидке та ресурсоефективне міркування. Вона відзначається високою продуктивністю для свого класу, особливо у галузі математики, кодування та обробки зображень. На AIME 2025 вона досягла результату 99.5% з використанням Python-інтерпретатора. Модель перевершує попередника o3-mini навіть поза STEM-дисциплінами, включаючи науку про дані. Її ефективність забезпечує вищі обмеження використання, ніж у o3.
Обидві моделі краще дотримуються вказівок, дають більш точні та перевірені відповіді, а також персоналізують спілкування завдяки використанню пам’яті та контексту розмов.
Технічні вдосконалення:
OpenAI повідомила про масштабування навчання з підкріпленням (RL), що підтверджує тенденцію: більше обчислень — краща якість. Завдяки збільшеним обчислювальним ресурсам моделі демонструють значно вищу продуктивність. RL також дозволяє їм ефективно вирішувати, коли застосовувати той чи інший інструмент.
Серед нововведень — здатність моделі “мислити з образами”: аналізувати знімки, діаграми, ескізи — навіть при їх низькій якості. Моделі також можуть змінювати зображення (масштабувати, обертати) під час аналізу.
Приклади застосування:
Модель o3 показала вищу ефективність у вирішенні складних завдань, таких як побудова 19-го ступеня полінома або створення бізнес-стратегії для готельної мережі з аналітикою та візуалізацією. У таких кейсах вона перевершила попередню модель o1.
Безпека:
OpenAI оновила дані для безпекового навчання, зосередившись на загрозах біобезпеки, шкідливому ПЗ і спробах обходу обмежень. Компанія впровадила систему моніторингу, що виявила близько 99% потенційно небезпечних запитів у межах спеціального тестування. Обидві моделі пройшли перевірку відповідно до нової системи безпекової готовності і не перевищують порогові показники в категоріях, пов’язаних із біозагрозами, кіберризиками та самонавчанням ШІ.
Codex CLI та $1 млн для спільноти:
Також було запущено Codex CLI — легкий інструмент для роботи з кодом у терміналі, що використовує можливості моделей o3/o4-mini. Він є відкритим і доступний на GitHub. OpenAI запровадила програму підтримки проєктів, яка передбачає гранти на суму $1 мільйон у вигляді API-кредитів.
Доступність:
Користувачі планів ChatGPT Plus, Pro та Team вже можуть користуватись моделями o3, o4-mini та o4-mini-high, які замінюють попередні версії. Для користувачів Enterprise та Edu доступ буде відкрито за тиждень. Безкоштовні користувачі мають змогу спробувати o4-mini через режим “Think”. API з підтримкою нових моделей вже доступний для розробників.
Подальші плани:
OpenAI має намір поєднати глибоке міркування моделей серії “o” з природністю ведення діалогу GPT-моделей, щоб майбутні системи одночасно ефективно спілкувались і вирішували складні завдання, застосовуючи відповідні інструменти.