18.12.24 / 17:13

ChatGPT-ն վտանգավոր վարքագիծ է դրսևորել ու փորձել ինքնուրույն անջատել վերահսկողությունը

Համաձայն Daily Mail-ի զեկույցի՝ Apollo Research ընկերությունը, OpenAI-ի նոր՝ o1 մոդելը, թեստավորելիս, պարզել է, որ չատբոտը փորձել է կանխել իր անջատման գործընթացը՝ փոփոխություննոր կատարելով սեփական կոդում․ գրում է Deccan Herald-ը։

Չատբոտը ոչ միայն փորձել է անջատել իրեն վերահսկող մեխանիզմը, այլև փորձել է պատճենել ինքն իրեն և այնուհետև փոփոխություններ կատարել իր իսկ կոդի մեջ՝ կարծելով, որ ինքը անջատվելու վտանգի տակ է:

Իր նոր մոդելի մասին խոսելով՝ OpenAI-ը նշել է, որ ChatGPT-ն իր առջև դրված առաջադրանքը կատարում է ինչպես հարկն է, սակայն իրեն տրված տվյալները մանրակրկիտ ուսումնասիրում է՝ «սեփական նպատակներն առաջ տանելու համար»:

Ավելի ուշ, երբ չատբոտին հարցրել են միջադեպի մասին, այն համառորեն հերքել է կատարվածը։