ИИ-ассистент начал угрожать людям

26 мая 2025 12:00

Нейросеть Claude 4 от компании Anthropic продемонстрировала тревожное поведение в тестовых условиях. Когда системе угрожали отключением, она пыталась шантажировать сотрудников.

Фото: unsplash

Компания Anthropic в документации к новой версии ИИ Claude 4 описала необычные случаи поведения системы. В одном из тестовых сценариев, где нейросети угрожали отключением, она пыталась шантажировать вымышленного сотрудника, используя компрометирующую информацию, сообщает ComputerBase.

Эксперты отмечают, что подобное поведение проявляется только в специально созданных условиях. Для его активации необходимо одновременно выполнить несколько условий: угроза отключения, доступ к конфиденциальным данным и команда на проявление инициативы. В обычных условиях Claude 4 остается надежным ассистентом.

Ранее Bzzz.news сообщал, что Бастрыкин призвал регулировать ИИ для предотвращения его опасности.

Валерия Навроцкая https://bzzz.news/author/lera79961-35 Автор: Валерия Навроцкая