Поддержать команду Зеркала
Беларусы на войне
  1. Генпрокуратура Литвы отправила неоднозначное письмо по поводу паспорта Новой Беларуси. Оно оказалось в распоряжении «Зеркала»
  2. В списке политиков, которые поздравили Лукашенко с «победой» на выборах, появились новые фамилии
  3. Просил у Сталина расстрелять побольше беларусов, а теперь в его честь есть улица в Минске. Рассказываем историю этого человека
  4. В Вашингтоне пассажирский самолет столкнулся с военным вертолетом, оба упали в реку. Есть погибшие
  5. Новшества по ЕРИП и пенсиям, судьба тарифов ЖКУ и дешевая мобильная связь. Подборка важных изменений, которые еще ожидают нас в 2025-м
  6. Путин нашел причину, по которой, по его мнению, невозможны мирные переговоры, и постоянно говорит об этом. Что стоит за его словами — ISW
  7. Лукашенко подписал указ, о котором чиновники «забыли», но документ затрагивает практически каждого жителя страны
  8. Политэмигрантка поехала в отпуск в Венесуэлу — и была задержана полицией. Рассказываем, что было дальше и какой беларуска увидела страну
  9. Через несколько месяцев появится существенное изменение по пенсиям. Надо совершить одно важное действие, чтобы не остаться без этих денег
  10. «Отомстить за этого самого Васю». Пропагандист признал, что вторгшиеся в Украину россияне убивают и пытают людей, и разгневал Бондареву
  11. Проверки и разборки между владельцами. В Минске признали банкротом частный медцентр
  12. «Быстрее бы все это закончилось». Поговорили с рабочим беларусского завода, помогающего России делать снаряды для «Градов»
  13. «У нас было два часа на сборы». Поговорили с завучем беларусской школы, которой пришлось бежать из страны после доноса Бондаревой


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.