Claude Mythos не випустять: яка причина

Як повідомляється з посиланням на Tom’s Hardware, компанія Anthropic представила нову модель штучного інтелекту Claude Mythos Preview, яка здатна знаходити критичні вразливості у програмному забезпеченні.

Попри технологічний прорив, розробники вирішили обмежити доступ до моделі через потенційні ризики її використання, адже вона здатна не лише виявляти слабкі місця, а й перетворювати їх на реальні інструменти атак, пише Traveller.

Чому Claude Mythos не випустять у відкритий доступ

Рішення Anthropic пов’язане з масштабом можливостей нової системи. ШІ вже виявив тисячі вразливостей у популярних операційних системах і браузерах.

Доступ до моделі отримали лише обмежені партнери:

великі технологічні компанії
фінансові установи
організації критичної інфраструктури

Серед них — провідні гравці індустрії, які зможуть використати інструмент для захисту власних систем.

У чому головна небезпека моделі

Claude Mythos відрізняється від попередніх моделей здатністю перетворювати знайдені вразливості на повноцінні експлойти. Це значно підвищує ризики її використання у зловмисних цілях.

Ключові показники:

72,4% виявлених вразливостей можуть бути перетворені на робочі експлойти
у 11,6% випадків ШІ отримує контроль над критичними процесами системи

Також модель здатна комбінувати кілька слабких місць у складні атаки, що раніше було доступно лише досвідченим хакерам.

Як модель тестували та що вона показала

Розробники провели масштабне тестування на тисячах відкритих репозиторіїв. Результати значно перевищили показники інших моделей.

Команда Frontier Red Team пояснила рівень небезпеки системи:

«Ми постійно запускаємо наші моделі на тисячах репозиторіїв із відкритим кодом і оцінюємо найгірші помилки за шкалою від простих збоїв до повного перехоплення управління. На відміну від інших моделей, Mythos Preview досяг повного контролю потоку на десяти окремих, повністю захищених цілях».

Які вразливості вже знайдені

Система змогла виявити критичні проблеми, які роками залишалися непоміченими:

27-річна вразливість у OpenBSD
16-річна помилка у бібліотеці FFmpeg
низка експлойтів у ядрі Linux, що дають root-доступ

При цьому значна частина знайдених проблем ще не виправлена.

Що планують у Anthropic далі

Компанія робить ставку на контрольоване впровадження технології. Модель використовуватиметься для підготовки індустрії до нової реальності, де подібні системи стануть звичними.

Основні напрямки:

співпраця з урядовими структурами
обмін даними про кіберзагрози
розвиток захисних механізмів

Нагадаємо, раніше ми писали про оновлення Marvel Rivals із новими персонажами, режимами та масштабними змінами у геймплеї гри.

Що нового?

Anthropic стримує запуск Claude Mythos: чому новий ШІ визнали занадто небезпечним для публіки

Чому Claude Mythos не випустять у відкритий доступ

У чому головна небезпека моделі

Як модель тестували та що вона показала

Які вразливості вже знайдені

Що планують у Anthropic далі

Схожі публікації