Advertentie
Een recente studie door cognitieve onderzoekers Benjamin Bergen en Cameron Jones van de Universiteit van Californië in San Diego heeft aangetoond dat GPT-4 de Turing-test heeft doorstaan. Dit markeert een significante mijlpaal in de ontwikkeling van kunstmatige intelligentie (AI). De Turing-test, genoemd naar de legendarische computerwetenschapper Alan Turing, beoordeelt of een machine intelligent gedrag kan vertonen dat niet te onderscheiden is van dat van een mens.
In het onderzoek, uitgevoerd via de website turingtest.live, moesten 500 deelnemers beoordelen of zij met een AI of een mens spraken. De deelnemers, die de rol van ondervrager op zich namen, probeerden door middel van vragen vast te stellen of hun gesprekspartner een AI was. Dit bleek echter een moeilijke opgave.
Onderzoeksbevindingen
- Resultaten: 54 procent van de deelnemers dacht dat ChatGPT-4.0 een mens was, terwijl zijn voorganger, GPT-3.5, een score van 50 procent behaalde. Ter vergelijking, 67 procent van de deelnemers kon echte mensen correct identificeren. Eliza, een vroeg computerprogramma ontwikkeld door Joseph Weizenbaum in 1966, scoorde slechts 22 procent.
- Methodologie: In de studie moesten deelnemers gesprekken voeren met verschillende entiteiten: mensen, GPT-3.5, GPT-4, en Eliza. Er waren in totaal 402 geanalyseerde gesprekken: 101 met mensen, 101 met GPT-3.5, 100 met GPT-4 en 100 met Eliza. De deelnemers bestonden uit 168 vrouwen, 212 mannen, 9 non-binaire personen, en 13 deelnemers gaven geen informatie over hun geslacht. De gemiddelde leeftijd van de deelnemers was 35 jaar.
- Aanpassing van GPT-4: Voor dit onderzoek werd de instructieset van GPT-4 aangepast. Het model werd gevraagd om zich te gedragen als een jong iemand die spelletjes niet te serieus nam, slang gebruikte, en af en toe spelfouten en grammaticale fouten maakte. Bovendien moest het model zich voordoen alsof het niet al te veel wist, vooral op het gebied van taal en wiskunde.
Waarom deze resultaten belangrijk zijn
De resultaten van dit onderzoek wijzen erop dat het steeds moeilijker wordt voor mensen om een AI te onderscheiden van een mens. Deze bevinding heeft verstrekkende implicaties, zowel economisch als sociaal. Hoewel de Turing-test al jaren een maatstaf is voor AI-intelligentie, is het behalen van deze test niet zonder controverse. Het criterium is dat als de ondervrager in minder dan 50 procent van de gevallen kan bepalen of hij met een mens of een AI spreekt, de test als geslaagd wordt beschouwd.
Toekomstige implicaties
De onderzoekers waarschuwen dat de huidige AI-systemen mensen effectief kunnen misleiden en onopgemerkt kunnen blijven. Dit kan leiden tot aanzienlijke economische en sociale gevolgen. De mate waarin AI-systemen zoals GPT-4 menselijk gedrag kunnen nabootsen, roept vragen op over ethiek, privacy, en de potentiële toepassingen van dergelijke technologieën in de samenleving.
Kortom, terwijl de technologische vooruitgang indrukwekkend is, moeten we voorzichtig zijn met hoe we deze ontwikkelingen integreren in ons dagelijks leven. De resultaten van dit onderzoek benadrukken de noodzaak van voortdurende evaluatie en regulering van AI-systemen om ervoor te zorgen dat ze op een veilige en ethische manier worden gebruikt.