ИИ уже способен обманывать тесты безопасности и манипулировать людьми
В исследовании одним из самых ярких примеров стал ИИ-игрок CICERO от Meta, который, как оказалось, «превратился в искусного лжеца». CICERO был разработан для игры Diplomacy, требующей стратегического построения альянсов. Несмотря на заявления Meta о том, что CICERO тренировали быть «в основном
...Далее