Turing-testen ble opprettet på slutten av 40-tallet i forrige århundre. Den engelske matematikeren Alan Matheson Turing prøvde å forstå om roboter kan tenke. Dette var det som fikk ham til å oppfinne.
Historien om etableringen av Turing-testen
Den engelske matematikeren Alan Matheson Turing er kjent som en unik spesialist innen datavitenskap, databehandling og kryptografi. Det var han som skapte prototypen til den moderne datamaskinen (Turing-datamaskinen). Forskeren hadde mange andre prestasjoner. På slutten av 40-tallet i forrige århundre begynte en matematiker å lure på hva slags elektronisk intelligens som kan betraktes som rimelig, og om en robot kan nærme seg menneskelig atferd så mye at samtalepartneren ikke vil forstå hvem som faktisk står foran ham.
Ideen om å lage en deig oppsto etter at Imitasjonsspillet ble populært i England. Denne morsomme, fasjonable for den tiden, involverte deltakelse av tre spillere - en mann, en kvinne og en dommer, i rollen som en person av noe kjønn kan være. Mannen og kvinnen gikk i separate rom og ga notater til dommeren. I henhold til skrivestilen og andre funksjoner burde dommeren ha forstått hvilke notater som tilhørte en spiller av ett eller annet kjønn. Alan Turing bestemte seg for at en av deltakerne kunne erstattes med en elektronisk maskin. Hvis eksperimentøren ikke i løpet av elektronisk fjernkommunikasjon kan bestemme hvilken av samtalepartnerne som er en ekte person og hvem som er en robot, kan testen betraktes som bestått. Og dette burde være årsaken til anerkjennelsen av intelligensen av kunstig intelligens.
Tar testen
I 1950 formulerte Alan Turing et system med spørsmål som kunne overbevise folk om at maskiner kan tenke.
Over tid ble testen modernisert, og ikke maskiner, men datamaskinroboter begynte å fungere oftere som testobjekter. I løpet av hele eksistensen av testen klarte bare noen få programmer å bestå den. Men noen eksperter satte spørsmålstegn ved denne suksessen. Riktige svar kan forklares ved en tilfeldighet, og selv i de beste tilfellene klarte ikke programmene å svare på mer enn 60% av spørsmålene. Det var ikke mulig å oppnå fullstendig tilfeldighet.
Et av programmene som besto Turing-testen var Eliza. Skaperne ga kunstig intelligens muligheten til å trekke ut nøkkelord fra en persons tale og komponere motspørsmål. I halvparten av tilfellene kunne folk ikke gjenkjenne at de kommuniserte med en maskin, og ikke med en live samtalepartner. Noen eksperter satte spørsmålstegn ved testresultatet på grunn av at arrangørene satte opp fagene på forhånd for live kommunikasjon og deltakerne i eksperimentet ikke engang skjønte at roboten kunne gi svar og stille spørsmål.
Vellykket kan kalles bestått test av programmet utarbeidet av Odessa-borgeren Yevgeny Gustman og den russiske ingeniøren Vladimir Veselov. Hun etterlignet personligheten til en gutt i en alder av 13 år. 7. juni 2014 ble den testet. Det deltok av 5 roboter og 30 virkelige mennesker. Bare 33 av 100 juryer kunne avgjøre hvilke svar som ble gitt av roboter, og hvilke som var virkelige mennesker. Slik suksess kan ikke bare forklares med et godt utformet program, men også ved at intelligensen til en tretten år gammel ungdom er noe lavere enn for en voksen. Kanskje noen av juryen ble villedet av denne omstendigheten.
Motstandere av anerkjennelsen av resultatet støttes også av det faktum at Zhenya Gustman, som opprettet programmet, skrev det på engelsk. Under testingen tilskrev mange dommere maskinens merkelige svar eller unngikk svar ikke bare til den tiltenkte samtalepartnerens alder, men også til språkbarrieren. De mente at roboten, som de tok for et menneske, ikke kjente språket godt.
Siden opprettelsen av Turing-testen har følgende programmer også nærmet seg bestått vellykket:
- "Mørkeblå";
- "Watson";
- "Parry".
Loebner-prisen
Når eksperter vurderer å bestå Turing-testen, er det ikke viktig å lage programmer og moderne roboter. Dette er bare en formalitet. Suksessen til en ny utvikling avhenger ikke av testresultatene. Det viktigste er at programmet skal være nyttig, å utføre bestemte oppgaver. Men i 1991 ble Lebnerprisen etablert. Innenfor sine rammer konkurrerer kunstige intelligenser med hverandre for å bestå testen. Det er 3 kategorier medaljer:
- gull (kommunikasjon med video- og lydelementer);
- sølv (for tekstkorrespondanse);
- bronse (tildelt bilen som oppnådde det beste resultatet i år).
Gull- og sølvmedaljer har ennå ikke blitt tildelt noen. Bronsepriser deles ut regelmessig. Nylig er det flere og flere søknader om deltakelse i konkurransen, ettersom nye budbringere og chatbots blir opprettet. Konkurransen har mange kritikere. Et raskt blikk på deltakerprotokoller de siste tiårene viser at en maskin lett kan oppdages med mindre sofistikerte spørsmål. De mest vellykkede spillerne siterer også vanskeligheten med Lebner-konkurransen på grunn av mangel på et dataprogram som kan føre en anstendig samtale i fem minutter. Det er generelt akseptert at konkurransesøknadene er utviklet utelukkende med det formål å motta en liten premie tildelt årets beste deltaker, og de er ikke designet for mer.
For tiden har Turing-testen mottatt flere moderne modifikasjoner:
- omvendt Turing-test (du må oppgi en sikkerhetskode for å bekrefte at brukeren er et menneske, ikke en robot);
- minimum intellektuell test (forutsetter bare alternativene "ja" og "nei" som svar);
- Turing metatest.
Ulemper med testen
En av de største ulempene ved testen er at programmet har til oppgave å lure en person, forvirre ham for å få ham til å tro på kommunikasjon med en ekte samtalepartner. Det viser seg at en som vet hvordan man manipulerer kan bli gjenkjent som tenking, og dette kan settes i tvil. I livet skjer alt litt annerledes. I teorien bør en god robot etterligne menneskelige handlinger så nøyaktig som mulig, og ikke forvirre samtalepartneren. Programmer som er designet spesielt for å bestå testen, unngår svar på de riktige stedene, siterer uvitenhet. Maskinene er programmert slik at korrespondansen ser så naturlig ut som mulig.
Mange forskere mener at faktisk Turing-testen vurderer likheten mellom talemåte mellom mennesker og roboter, men ikke evnen til kunstig intelligens til å tenke, som skapt av det. Skeptikere hevder at orienteringen mot slik testing bremser fremgangen og hindrer vitenskapen i å bevege seg fremover. I forrige århundre var bestått testen en stor prestasjon og til og med noe fantastisk, men i dag kan ikke en datamaskins evne til å "korrespondere som en person" kalles overnaturlig.