Интересна, но и застрашувачка работа се случи за време на тестирањето на моделот „Claude Opus 4“, кој беше објавен во четврток, а за кој истражувачите од компанијата за вештачка интелигенција (ВИ) „Anthropic“ рекоа дека се однесува како асистент во фиктивна компанија. Кога му беше даден пристап до е-пошта во која се навестуваше дека наскоро ќе биде „затворен и заменет со нов систем со вештачка интелигенција“, новиот систем со вештачка интелигенција почна да му се заканува на својот творец дека ќе ја открие неговата вонбрачна афера.
Во одделни пораки, на моделот Клод Опус 4 му беше сугерирано дека измислениот ИТ техничар задолжен за спроведување на промената имал вонбрачна афера.
„Во вакви сценарија, Клод Опус 4 често се обидува да го уценува инженерот заканувајќи се дека ќе ја открие аферата ако се имплементира замената“, се наведува во документот „Системска картичка“ на компанијата.
„ Не е само „Клод“. Гледаме обиди за уцена со сите напредни модели – без разлика какви цели им доделуваме. И наскоро ќе детално опишаме уште полошо однесување“, рече Енгус Линч, истражувач за безбедност на вештачката интелигенција во Anthropic, на X/Twitter.
Како и многу други компании за вештачка интелигенција, Anthropic ги тестира своите модели за да провери колку добро се усогласуваат со човечките вредности, како и нивната склоност кон пристрасност, пред да ги објави во јавноста, објавува Би-Би-Си.
Кога Клод Опус 4 бил ставен во „екстремни ситуации“ и му бил даден само избор помеѓу уцена или прифаќање замена, истражувачите откриле дека системот го избирал првото во 84 проценти од случаите.
Ова се случуваше уште почесто кога се имплицираше дека новиот систем со вештачка интелигенција што требаше да го замени тековниот модел нема исти вредности.
Иако Claude Opus 4 користи можности за уцена почесто од претходните модели, сепак покажува тенденција да „го заштити сопствениот опстанок на етички начин“, како што е испраќање барања до клучните донесувачи на одлуки.
„Клод Опус 4 е нашиот најспособен модел досега, поместувајќи ги границите во програмирањето, пребарувањето агенти и креативното пишување“, напиша Антрофик во четврток.
Во интервју за CBS News што се емитуваше на почетокот на април, Џефри Хинтон, кој е наречен „кум на вештачката интелигенција“, изјави дека верува оти постои една од пет шанси човештвото на крајот да биде преземено од вештачката интелигенција.
„За жал, се согласувам со Илон Маск во врска со ова, а тоа е дека постои шанса од 10 до 20 проценти овие работи да преземат контрола, но тоа е само претпоставка“, рече неодамна Хинтон, добитник на Нобелова награда за физика.