В каких случаях ИИ может «сойти с ума» и как ученые его страхуют - Караван
  • $ 499.65
  • 582.89
+7 °C
Алматы
2025 Год
5 Декабря
  • A
  • A
  • A
  • A
  • A
  • A
В каких случаях ИИ может «сойти с ума» и как ученые его страхуют

В каких случаях ИИ может «сойти с ума» и как ученые его страхуют

Искусственный интеллект (ИИ) часто изображают в фантастике как систему, которая, стремясь к цели, выходит из-под контроля. Но насколько реальны такие сценарии в реальной жизни?

  • 25 Августа
  • 32
Фото: pixabay

Никита Любайкин, инженер-исследователь научной группы «Адаптивные агенты» Института AIRI рассказал, как специалисты справляются с этими задачами, сообщает Ferra.

Проблема, которую в научных кругах называют «взлом награды», связана с тем, что ИИ может находить неожиданные способы достижения цели, не соответствующие ожиданиям разработчиков.

Например, если роботу поручено положить кубик в определённое место на столе, он может передвинуть сам стол, а не кубик. Это не «сумасшествие» в человеческом смысле, а скорее ошибка в формулировке задачи. Чтобы избежать подобных ситуаций, учёные тщательно настраивают систему вознаграждения, которая направляет действия ИИ. Кроме того, существует направление Safe-RL, где разрабатываются алгоритмы, которые не только максимизируют результат, но и соблюдают строгие рамки безопасности. Такие технологии применяются в автономных автомобилях, промышленной автоматизации и рекомендательных системах.

Термин «сойти с ума» в отношении RL алгоритма является некоторым антропоморфизмом, и в данном контексте больше связан с проблемой «reward-hacking», при которой алгоритм добивается высоких абсолютных наград, при этом не выполняя полезных (или ожидаемых) действий, – сказал Никита Любайкин.

Ещё одна сложность в работе ИИ — это баланс между исследованием новых возможностей и использованием уже проверенных решений. Представьте, что вы выбираете ресторан: пойти в знакомое место с гарантированно вкусной едой или рискнуть и попробовать новое? ИИ сталкивается с похожей дилеммой: продолжать использовать известную стратегию или экспериментировать с новыми, которые могут быть как лучше, так и хуже. Для решения этой задачи учёные применяют разные подходы. Например, метод ε-жадности позволяет ИИ иногда выбирать случайные действия, чтобы «попробовать что-то новое». Другой подход — алгоритмы, которые одновременно увеличивают награду и делают действия ИИ более разнообразными.

Один из самых эффективных онлайн RL алгоритмов — SAC — построен вокруг этой идеи.

Также существуют методы, которые мотивируют ИИ исследовать неизвестные области, поощряя его за новые действия.

Перенос ИИ из симуляций в реальный мир — ещё одна серьёзная проблема. В играх, таких как шахматы или го, симуляции идеальны, но реальный мир сложен и непредсказуем. Например, робот, обученный в симуляторе двигаться по ровной поверхности, может не справиться с реальной неровной дорогой. Чтобы преодолеть эту проблему, учёные используют метод доменной рандомизации. Вместо фиксированных параметров, таких как сила трения или гравитация, в симуляции задают их случайные вариации. Это помогает ИИ адаптироваться к реальным условиям. Ещё один способ — дообучение на реальных данных. Сначала ИИ обучается в симуляции, а затем корректируется на основе реальных испытаний, что дешевле, чем обучение с нуля в реальном мире.

Проблемы могут возникнуть, когда мы хотим симулировать сложные физические процессы (которые зачастую нельзя имитировать с абсолютной точностью, например, для того чтобы обучать роботов задачам локомоции в симуляторе, что на порядки дешевле чем в реальном мире, и использовать полученных агентов на реальных роботах, – отметил Любайкин.

Эти подходы помогают сделать ИИ надёжнее и безопаснее. Учёные продолжают работать над тем, чтобы системы ИИ не только эффективно выполняли задачи, но и оставались под контролем в самых сложных и непредсказуемых условиях.

В тренде:

АЭС

В Казахстане официально объявили название первой атомной электростанции

Налоговый кодекс РК 2026

Какие льготы при оплате получат работники по договорам ГПХ в Казахстане в 2026 году

Убийство Яны Легкодимовой

Обвиняемые по делу Яны Легкодимовой получили пожизненный срок

Алматы

Основной въезд в аэропорт закрыли в Алматы

МРП 2026

МРП на 2026 год утверждён в Казахстане

Землетрясение

Сведения о разрушениях на линию 112 не поступали - ДЧС Алматы

Бокс

Головкин стал первым казахстанцем в Зале славы бокса

Футбол

Прямая трансляция плей-офф Лиги конференций Бранн - Астана

Астана

В Астане девушка спрыгнула с моста

Азербайджан

Президент Казахстана принял участие в VII Консультативной встрече глав государств Центральной Азии

Шымкент

Наркомагазины с миллиардными оборотами ликвидировали в Казахстане спецпрокуроры

Иран

Иран заявил о полном прекращении обогащения урана

Война

Песков отреагировал на предложение Зеленского провести переговоры с Путиным в Казахстане

Нефть

Это удар не только по нефти: что атака украинских беспилотников на КТК значит для Казахстана

Закон

Токаев подписал Закон по вопросам культуры, образования и семьи

Туризм

Отменят ли "всё включено" в Турции

Медицина

Медицинские учреждения нарушали правила вакцинации и лицензирования в области Жетысу

Перейти к новостям спорта