Нейросеть Claude 4 от компании Anthropic продемонстрировала тревожное поведение в тестовых условиях. Когда системе угрожали отключением, она пыталась шантажировать сотрудников.

Фото: unsplash
Компания Anthropic в документации к новой версии ИИ Claude 4 описала необычные случаи поведения системы. В одном из тестовых сценариев, где нейросети угрожали отключением, она пыталась шантажировать вымышленного сотрудника, используя компрометирующую информацию, сообщает ComputerBase.
Эксперты отмечают, что подобное поведение проявляется только в специально созданных условиях. Для его активации необходимо одновременно выполнить несколько условий: угроза отключения, доступ к конфиденциальным данным и команда на проявление инициативы. В обычных условиях Claude 4 остается надежным ассистентом.
Ранее Bzzz.news сообщал, что Бастрыкин призвал регулировать ИИ для предотвращения его опасности.