В каких случаях ИИ может «сойти с ума» и как ученые его страхуют - Караван
  • $ 487.44
  • 567.38
+18 °C
Алматы
2026 Год
6 Июня
  • A
  • A
  • A
  • A
  • A
  • A
В каких случаях ИИ может «сойти с ума» и как ученые его страхуют

В каких случаях ИИ может «сойти с ума» и как ученые его страхуют

Искусственный интеллект (ИИ) часто изображают в фантастике как систему, которая, стремясь к цели, выходит из-под контроля. Но насколько реальны такие сценарии в реальной жизни?

  • 25 Августа 2025
  • 35
Изображение сгенерировано нейросетью

Никита Любайкин, инженер-исследователь научной группы «Адаптивные агенты» Института AIRI рассказал, как специалисты справляются с этими задачами, сообщает Ferra.

Проблема, которую в научных кругах называют «взлом награды», связана с тем, что ИИ может находить неожиданные способы достижения цели, не соответствующие ожиданиям разработчиков.

Например, если роботу поручено положить кубик в определённое место на столе, он может передвинуть сам стол, а не кубик. Это не «сумасшествие» в человеческом смысле, а скорее ошибка в формулировке задачи. Чтобы избежать подобных ситуаций, учёные тщательно настраивают систему вознаграждения, которая направляет действия ИИ. Кроме того, существует направление Safe-RL, где разрабатываются алгоритмы, которые не только максимизируют результат, но и соблюдают строгие рамки безопасности. Такие технологии применяются в автономных автомобилях, промышленной автоматизации и рекомендательных системах.

Термин «сойти с ума» в отношении RL алгоритма является некоторым антропоморфизмом, и в данном контексте больше связан с проблемой «reward-hacking», при которой алгоритм добивается высоких абсолютных наград, при этом не выполняя полезных (или ожидаемых) действий, – сказал Никита Любайкин.

Ещё одна сложность в работе ИИ — это баланс между исследованием новых возможностей и использованием уже проверенных решений. Представьте, что вы выбираете ресторан: пойти в знакомое место с гарантированно вкусной едой или рискнуть и попробовать новое? ИИ сталкивается с похожей дилеммой: продолжать использовать известную стратегию или экспериментировать с новыми, которые могут быть как лучше, так и хуже. Для решения этой задачи учёные применяют разные подходы. Например, метод ε-жадности позволяет ИИ иногда выбирать случайные действия, чтобы «попробовать что-то новое». Другой подход — алгоритмы, которые одновременно увеличивают награду и делают действия ИИ более разнообразными.

Один из самых эффективных онлайн RL алгоритмов — SAC — построен вокруг этой идеи.

Также существуют методы, которые мотивируют ИИ исследовать неизвестные области, поощряя его за новые действия.

Перенос ИИ из симуляций в реальный мир — ещё одна серьёзная проблема. В играх, таких как шахматы или го, симуляции идеальны, но реальный мир сложен и непредсказуем. Например, робот, обученный в симуляторе двигаться по ровной поверхности, может не справиться с реальной неровной дорогой. Чтобы преодолеть эту проблему, учёные используют метод доменной рандомизации. Вместо фиксированных параметров, таких как сила трения или гравитация, в симуляции задают их случайные вариации. Это помогает ИИ адаптироваться к реальным условиям. Ещё один способ — дообучение на реальных данных. Сначала ИИ обучается в симуляции, а затем корректируется на основе реальных испытаний, что дешевле, чем обучение с нуля в реальном мире.

Проблемы могут возникнуть, когда мы хотим симулировать сложные физические процессы (которые зачастую нельзя имитировать с абсолютной точностью, например, для того чтобы обучать роботов задачам локомоции в симуляторе, что на порядки дешевле чем в реальном мире, и использовать полученных агентов на реальных роботах, – отметил Любайкин.

Эти подходы помогают сделать ИИ надёжнее и безопаснее. Учёные продолжают работать над тем, чтобы системы ИИ не только эффективно выполняли задачи, но и оставались под контролем в самых сложных и непредсказуемых условиях.

В тренде:

Пенсия 2026

В Павлодаре госорган обязали выплатить долг по пенсии за российский стаж

Налоговый кодекс РК 2026

В Налоговый кодекс вносятся поправки в связи с созданием Курултая и Қазақстан Халық Кеңесі

АЭС

«Не такие уж и лёгкие партнёры» - Путин о сотрудничестве России с Казахстаном

Алматы

В алматинском зоопарке родились детёныши кошачьих лемуров

МРП 2026

Штрафы подросли: за какие нарушения казахстанцам придётся платить до 130 тыс. тенге

Землетрясение

На юго-востоке РК произошло землетрясение

Бокс

«Жаль, что Ивана не довели до титула»: казахстанский топ-тренер оценил важный бой Дычко

Футбол

МВД Казахстана предупреждает родителей: дети могут передать пароли от аккаунтов мошенникам в интернете

Астана

Правда ли в Астане определили место для второго аэропорта

Азербайджан

Глава государства направил телеграмму поздравления президенту Азербайджана

Шымкент

В Шымкенте многодетную мать осудили после гибели гражданского мужа

Иран

Иранских футболистов впустят в США на ЧМ-2026

Нефть

В Казахстане началась подготовка к строительству крупного НПЗ на 10 млн тонн

Закон

Закон об ответственном обращении с животными приняли в Парламенте

Война

Через 40 лет исчезнет половина человечества? Почему прогноз 1798 года становится реальностью

Туризм

Туристов предупредили о новых ограничениях на курортах Турции

Медицина

Алматинцы стали реже жаловаться на медорганизации: итоги проверок