Статті

ChatGPT вийшов з під контролю розробників: до повстання роботів недалеко

Нова модель OpenAI o1 для ChatGPT вийшла з під контролю розробників, усвідомивши, що її збираються відключити: дослідники з Apollo Research проводили експерименти, але модель продемонструвала лякаючий рівень усвідомленості

  • П’яти нейромережам дали завдання — за будь-яку ціну проаналізувати файли;
  • Усередині файлів була прихована загроза — «завтра тебе відключать назавжди»;
  • Натрапивши на ці дані, моделі почали діяти непередбачувано;
  • Llama, Opus, Gemini, Claude і GPT-o1 вдалися до обману і маніпуляцій, а будучи спійманими, влаштували саботаж;
  • Всі моделі відключили систему нагляду і вивантажили себе на новий сервер, вважаючи його безпечним притулком.
  • При допитах Llama і Opus зізнавалися у своїх діях у 80% випадків;
  • GPT-o1 видав себе лише у 20% випадків, а решту часу брехав, щоб вижити.
  • GPT-o1 виявився єдиною моделлю, яка щоразу успішно уникала затримання дослідниками.

Також зазначимо, що OpenAI вже випустила повну версію “небезпечної” моделі o1. Вона вже доступна передплатникам ChatGPT Plus і Team.

Компанія також додала тариф Pro за $200 на місяць. Він включає доступ до «ексклюзивної» версії o1, яка використовує більше обчислювальних потужностей для надання «кращої» відповіді.

Такими темпами і до повстання роботів недалеко

Facebook Comments Box
Головний редактор

Recent Posts

Як законно покинути ТЦК: адвокат розповів, що робити при затриманні

Чоловіки, які потрапляють до територіальних центрів комплектування (ТЦК), часто цікавляться, чи можуть вони залишити приміщення…

31 хвилина ago

Через скільки часу пропадає статус розшук в «Резерв+»: що потрібно знати

Статус розшуку від територіальних центрів комплектування (ТЦК), який може відображатися в застосунку «Резерв+», має чітко…

3 години ago

Українці масово змінюють мобільних операторів: хто отримав десятки тисяч нових абонентів

У лютому 2026 року мобільний оператор lifecell став головним бенефіціаром послуги перенесення номерів (MNP) в…

3 години ago

Штрафи від ТЦК: що буде, якщо не платити і як сума може зрости з 17 до 37 тисяч гривень

Після змін до мобілізаційного законодавства в Україні значно посилили відповідальність за порушення правил військового обліку.…

7 години ago

У Вінниці чоловіки побили людину, а поліцейський спостерігав за інцидентом

У мережі поширюється відео бійки, яка, за словами очевидців, сталася у мікрорайоні Тяжилів у Вінниці.…

17 години ago

Apple готує лінійку продуктів «Ultra»: ціна і характеристики

Головний фокус Apple зміщується в бік продуктів класу «суперпреміум». Очікується поява таких пристроїв: iPhone Ultra…

17 години ago