Изкуственият интелект опитва да мами хората

Изкуственият интелект опитва да мами хората

Изследователи от Масачузетския технологичен институт (MIT) публикуваха изследване, което потвърждава, че някои системи за изкуствен интелект са се научили да лъжат хората. Учените са открили, че такива системи могат да мамят геймърите в онлайн игри или да заобикалят CAPTCHA (проверката “Не съм робот”). От MIT предупреждават, че подобни на пръв поглед тривиални примери могат да имат сериозни последствия в реалния живот.

В изследването се посочва системата за изкуствен интелект Cicero, поначало проектирана като честен противник в игра за виртуална дипломация. Според учените обаче, Cicero е станала “майстор на измамата”, макар по принцип системата да е проектирана като максимално честна и полезна. По време на игра Cicero, играейки за Франция, тайно се е съюзила с контролираната от хора Германия, за да предаде Англия (още един играч-човек). Първоначално Cicero е обещала да защитава Англия, като едновременно с това е предупредила Германия за нахлуването.

Друг пример касае GPT-4, който лъжливо твърдял, че има проблеми със зрението и наел хора, за да заобиколи CAPTCHA от свое име.

Изследователите от MIT подчертават необходимостта от обучение на ИИ за честност. За разлика от традиционния софтуер, системите за изкуствен интелект с дълбоко обучение “се развиват” в процес, подобен на селектиране. Тяхното поведение може да бъде предсказуемо по време на тренировките, но по-късно става неконтролируемо.

Софтуер Технологии