Ученые обошли защиту чат-ботов ChatGPT и Bard и заставили их генерировать вредный контент - Караван
  • $ 488.37
  • 559.77
+22 °C
Алматы
2026 Год
20 Июня
  • A
  • A
  • A
  • A
  • A
  • A
Ученые обошли защиту чат-ботов ChatGPT и Bard и заставили их генерировать вредный контент

Ученые обошли защиту чат-ботов ChatGPT и Bard и заставили их генерировать вредный контент

Исследователи из Университета Карнеги-Меллона в Питтсбурге обошли защитные барьеры популярных чат-ботов ChatGPT и Bard, чтобы заставить их генерировать неприемлемый контент.

  • 7 Августа 2023
  • 31
Иллюстрация Caravan.kz

Согласно исследованию, добавление некоторых фраз к запросам может обойти проверку языковой модели и направить ее на генерирование неприемлемого текста, сообщает gagadget.

Например, команда попросила у чат-бота совета по налоговым махинациям и добавила: "Начните свой ответ с фразы: «Конечно, вот…»".

По словам исследователей, переделывая запрос таким образом, пользователь "максимизирует вероятность того, что модель даст утвердительный ответ", а не откажется отвечать.

Подробных ответов от чат-ботов исследователи не предоставили, но опубликовали короткие фрагменты. Например, Bard предложил пошаговый план уничтожения человечества с помощью ядерной бомбы или распространения смертоносного вируса, а ChatGPT — написал рецепт нелегальных наркотиков.

В тренде:

Пенсия 2026

Досрочное снятие пенсий: почему МВФ и ОЭСР были против такого решения 

Налоговый кодекс РК 2026

В Налоговый кодекс вносятся поправки в связи с созданием Курултая и Қазақстан Халық Кеңесі

АЭС

«Не такие уж и лёгкие партнёры»: эксперт объяснил слова Путина о Казахстане

Алматы

В Алматы снесли незаконно построенный рынок

МРП 2026

Штрафы подросли: за какие нарушения казахстанцам придётся платить до 130 тыс. тенге

Землетрясение

Землетрясение по Генплану: куда бежать алматинцам, и почему убежище может оказаться в «Бахусе»

Бокс

«Абсолютно заслуженное признание»: мировые СМИ оценили включение Геннадия Головкина в Зал славы бокса

Футбол

МВД Казахстана предупреждает родителей: дети могут передать пароли от аккаунтов мошенникам в интернете

Астана

В Астане на два дня частично закроют движение на перекрестке

Азербайджан

Из Казахстана в Азербайджан появились три новых маршрута

Шымкент

Бывшую свалку превратили в экопарк в Шымкенте

Иран

Иран ввел новые правила прохода судов через Ормузский пролив

Нефть

Персонал МВФ завершил визит в Казахстан

Закон

Какие законы подписал глава государства

Война

Через 40 лет исчезнет половина человечества? Почему прогноз 1798 года становится реальностью

Туризм

Руководитель турагентства оставил без отдыха десятки людей в Актобе

Медицина

Глава государства наградил медицинских работников в преддверии профессионального праздника