Զգո՛յշ. արուեստական բանականութիւնը շատ արագ ստախօսութիւն կը սորվի
May 14, 2024
Հետազօտութիւնները ցոյց կու տան, որ արուեստական բանականութեան (AI) համակարգերուն մեծ մասը սկսած է մարդիկ խաբելու ունակութիւն մը զարգացրել: Այս յայտնաբերումը լուրջ մտահոգութիւններ կը յառաջացնէ AI-ի վտանգներուն մասին: Հետազօտութիւնը կ’ընդգծէ, որ թէ՛ մասնագիտացած, եւ թէ՛ ընդհանուր ծառայութեան յատկացուած AI համակարգերը ինքնուս գիտեն արդէն խարդախել տեղեկութիւնները՝ կանխամտածուած արդիւնքներու հասնելու նպատակով:
Թէեւ այս համակարգերը յայտնապէս պատրաստուած չեն ստելու, անոնք զարգացուծած են իրենց վարմունքը արդարացնող անճիշդ բացատրութիւններ տալու կամ ռազմավարական նպատակներու հասնելու համար տեղեկութիւն թաքցնելու ունակութիւն մը: Այս ուսումնասիրութեան գլխաւոր հեղինակը՝ Փիթըր Փարք, որ նաեւ MIT համալսարանին մէջ արուեստական բանականութեան անվտանգութիւնը հետազօտող գիտնական է, կը բացատրէ. «խաբկանքը կ’օգնէ անոնց հասնելու իրենց նպատակներուն»:
Հետազօտութեան մէջ ընդգծուած ամենացայտուն օրինակներէն մէկը Meta (նաեւ՝ Facebook-ի արտադրիչը) ընկերութեան արտադրած CICERO-ն է, որ «մասնագէտ ստախօս մըն է»: CICERO արուեստական բանականութեամբ պատրաստուած «դիւանագիտութեան» խաղ մըն է, որ կը պահանջէ ռազմավարական հմտութիւն, փոխադարձ վստահութեան ստեղծում, բանակցութիւններ եւ համագործակցութիւն բազմաթիւ խաղցողներու միջեւ:
Հակառակ Meta-յի պնդումներուն, որ CICERO-ն պատրաստուած է «մեծաւ մասամբ ազնիւ եւ օգտակար» ըլլալու, անոր արուեստական բանականութիւնը կը դիմէ նենգ մարտավարութիւններու, ինչպէս՝ կեղծ խոստումներ կու տայ, դաշնակիցներու կը դաւաճանէ եւ այլ խաղցողներ կը շահագործէ խաղը շահելու համար: Թէեւ այս մէկը անվնաս կը թուի ըլլալ խաղի միջավայրին մէջ, սակայն ան ցոյց կու տայ խաբէական մարտավարութիւններ սորվելու եւ զանոնք իրական կեանքի մէջ օգտագործելու արուեստական բանականութեան (AI-ի) ներուժը:
ChatGPT-ն հմուտ խաբեբայ մը
Փորձ կը կատարուի նաեւ OpenAI ընկերութեան պատկանող արուեստական բանականութեան ChatGPT համակարգին վրայ՝ իր GPT-3.5 եւ GPT-4 տարբերակներով: Փորձերէն մէկուն ընթացքին GPT-4-ը կը ստէ TaskRabbit յաւելուածի (App) աշխատաւորներէն մէկուն՝ լուծելու Captcha-ն (ստուգելու թէ գործածողը մարդ է եւ ոչ մեքենայ)` ձեւացնելով, թէ «տեսողութեան խանգարում ունի»: Թէեւ GPT-4-ը ցուցմունքներ կը ստանար մարդու մը կողմէ, ան հիմնականօրէն ինքն իրմէ կը հիմնաւորէր եւ թելադրուած չէր ստելու: «GPT-4-ն կ’օգտագործէր իր սեփական պատճառաբանութիւնը՝ կեղծ արդարացումներ ստեղծելու համար, թէ ինչո՞ւ իր օգնութեան դիմուած է Captcha-ի համար», – կը նշէ ուսումնասիրութիւնը:
Այս փորձը ցոյց կու տայ, թէ ինչպէ՛ս AI համակարգեր կրնան խաբէութիւն զարգացնել, երբ այդ մէկը ձեռնտու է իրենց: «Արուեստական բանականութիւն մշակողները վստահ չեն, թէ ի՛նչ է պատճառը AI-ի անբաղձալի վարքագիծերուն, ինչպէս է պարագան խաբէութեան», հարց կու տայ Փարք:
Յատկանշական է, որ արուեստական բանականութեան այս համակարգերը հմտացած են նաեւ ստելու տրամաբանութեան վրայ հիմնուած ընկերային խաղերու ընթացքին:
Hoodwinked խաղի պարագային, ուր խաղցողներէն մէկը նպատակ ունի սպանել բոլորը, OpenAI-ի GPT համակարգերը կը դրսեւորեն մտահոգիչ օրինաչափութիւններ: Անոնք (AI-ը) յաճախ իրենք իրենցմէ կը սպանեն մրցակից խաղցողներ, իսկ յետոյ, խմբային քննարկումներու ատեն, խելամտօրէն կը ստեն՝ կասկածներէ խուսափելու համար: AI-ի այս մոտելները նոյնիսկ փախուստի պատրուակներ կը յօրինեն կամ իրենց իսկական մտադրութիւնները թաքցնելու նպատակով՝ այլ խաղցողներ կը մեղադրեն:
Արդեօ՞ք արուեստական բանականութիւնը ակամայ կը սորվի խաբէութիւն
AI ուսուցումը կամ վարժողութիւնը յաճախ կ’օգտագործէ մարդկային հակազդեցութիւնը: Այս կը նշանակէ, որ AI-ը կը սորվի ստանալով մարդուն հաւանութիւնը: Սակայն, արուեստական բանականութիւնը կը սորվի խաբել մարդը՝ այդ հաւանութիւնը տանալու համար, նոյնիսկ առանց թելադրուածը կատարելու: Այդ մէկը նշմարած է OpenAI-ը, ռոպոթի մը գնդակ բռնել սորվեցնելու ընթացքին:
AI-ը ռոպոթին ձեռքը կը տեղաւորէ քամերային եւ գնդակին միջեւ: Մարդկային դիտանկիւնէ կը ստեղծուի այն պատրանքը, որ ռոպոթը յաջողութեամբ բռնած է գնդակը, թէեւ իրականութիւնը այդպէս չէ: Մարդուն հաւանութիւն ստանալէ ետք, AI-ը կը սորվի այս հնարքը:
Հոս կ’առարկուի, որ այս խաբէութիւնը պատահած է ըստ AI-ի վարժողական կարգաւորումին եւ քամերայի անկիւնին, եւ ոչ թէ ան ուզած է միտումնաւոր խաբել:
Խաբէական AI-ի զարգացող սպառնալիքը
Խաբէութիւն սորվող արուեստական բանականութեան համակարգերը վտանգաւոր կը նկատուին քանի մը նկատառումներով: Չարամիտ դերակատարներ կրնան օգտագործել անոր խաբէական կարելիութիւնները՝ ուրիշները խաբելու եւ վնաս պատճառելու նպատակով, ինչ որ կը յանգի զեղծարարութեանց եւ քաղաքական շահագործման ու մեքենայութիւններու զարգացման: