Captcha [1] (fra CAPTCHA - Engelsk C ompletely A utomated Public T uring test to tell Computers and Humans A part - en fuldautomatisk offentlig Turing-test til at skelne mellem computere og mennesker ) er en computertest, der bruges til at afgøre, om brugeren af systemet er et menneske eller en computer.
Udtrykket "Captcha" dukkede op i 2000. Hovedideen med testen er at tilbyde brugeren en opgave, der let kan løses af en person, men ekstremt vanskelig og tidskrævende for en computer. Fra 2013 indtastes cirka 320 millioner captchas hver dag af brugere over hele planeten [2] .
CAPTCHA er et varemærke tilhørende Carnegie Mellon University , som udviklede denne test.
I den mest almindelige version af captcha indtaster brugeren tegnene vist på billedet (ofte med tilføjelse af støj eller gennemskinnelighed), men på en sådan måde, at maskingenkendelse af teksten er meget vanskelig. Ifølge almindeligt accepterede standarder for internettilgængelighed for synshandicappede bør en sådan captcha suppleres med en variant baseret på talegenkendelse (audio captcha). Der er også captchas, hvor du skal vælge det rigtige billede fra listen [3] .
Andre dårligt algoritmiske opgaver kan også bruges: find for eksempel ud af, hvad der er på billedet, marker alle billeder med katte, eller besvar et spørgsmål relateret til menneskers viden eller mentalitet (for eksempel gåden: "en pære hænger , du kan ikke spise det"). Ikke desto mindre er det karaktergenkendelse, der er blevet standarden: det er ikke bundet til nogen kultur (den største hindring er dårligt syn), det fungerer selv på mobile browsere, og en erfaren bruger genkender hurtigt et billede som en captcha. Kombinerede captchas er også mulige.
Ulempen ved captcha er, at det ikke altid er muligt at parse det. På grund af dette skal du nogle gange indtaste captchaen flere gange.
Antag, at billedet med tallene 1234 kaldes af koden:
< img src = "/captcha.php?code=1234" />I stedet for at videregive captchaen læser maskinen URL'en og indtaster svaret 1234 .
Med utilstrækkelige kvalifikationer hos en webprogrammør kan en bot give et svar uden at bestå testen. For eksempel, ifølge nogle oplysninger på siden, er computeren selv, uden menneskelig indgriben, i stand til at svare korrekt på et spørgsmål, som kun en person formodentlig kunne besvare. Eller en person består testen én gang, og computeren fremstiller mange anmodninger med det samme svar.
Det bruges primært til "ikke-traditionelle" captchas med et lille antal svarmuligheder (1000 eller mindre). Robotten "gætter" ved at sende tilfældige svar, og nogle af dem viser sig at være rigtige.
Denne tilgang er effektiv, når spørgsmålene er udarbejdet af administratoren og ikke genereret af maskinen. Ved hjælp af databaser kan du gennemgå mange ikke-traditionelle captcha-muligheder: Marker for eksempel alle billeder med katte.
Efter cutoff dannes der et tilfældigt mønster på bogstaverne, så der er ingen 100 % garanti for, at alle karakterer bliver genkendt (i PWNtcha er vurderingen af denne CAPTCH 99 %). Men den resterende ene procent er fuldstændig irrelevant.
Den nye phpBB-forumtråd (3.xx) har som standard en forbedret CAPTCHA ved hjælp af GD Graphics Library .
Der er programmer (for eksempel: PWNtcha), der genkender specifikke captcha-implementeringer. Derudover er det muligt at forbinde moduler fra generelle tekstgenkendelsesprogrammer (for eksempel: FineReader , OmniPage ) til tredjepartsprogrammer til captcha-billedgenkendelse.
I forhold til automatiseret genkendelse er der begreberne "svag captcha" og "stærk captcha". Blandt "svaghederne" er en fast skrifttype, en fast placering af tegn, ingen forvrængning, adskillelse af tegn fra baggrunden ved hjælp af en farvetast eller Gaussisk sløring , let adskillelse af tegn fra hinanden osv. Nogle gange sker det dog, at en stærk captcha er svær at genkende og for en person, hvilket allerede er en uacceptabel ekstrem. Af og til er der en captcha, der let kan læses af en computer og med stort besvær af en person (f.eks. med et billede med lav kontrast), en sådan captcha svarer slet ikke til formålet med captchaen som sådan.
Hvis det genererede billede viste sig at være ulæseligt, har brugeren som regel mulighed for at få et nyt. En stærk captcha skulle returnere et billede med et andet svar [4] .
Mange utraditionelle captcha-varianter viste sig også at være svage - "ikke-robotresistente" [5] [6] .
Der er en "genkendelsesmetode", der bruger en menneskelig ressource fra meget besøgte websteder. Robotten downloader captcha'en fra den nødvendige internettjeneste og præsenterer den for den besøgende på webstedet. Til gengæld får den besøgende adgang til ressourcen, og robotten genkender koden vist på billedet og indtaster den på det "stormede" site. En besøgende har måske ikke engang mistanke om, at hver video, de ser, bliver til registrering af en ny postkasse til at sende spam.
For at beskytte (ikke helt) mod denne metode til at omgå captcha, ændrer webstedet automatisk captcha-billedet, hvis svaret på det ikke blev indtastet med det samme (inden for en kort periode), regelmæssigt hver gang efter et vist tidsrum, eller når du forsøger at starte et forsinket svar.
Der er også specialiserede sider til at udveksle eller sælge captchas.
Captcha alene kan ikke stoppe spammere . På den anden side kan denne beskyttelsesmetode være til stor gene for mennesker.
Derudover misbruges captcha, for eksempel af filhosting , hvilket bringer tjenester til captcha-genkendelse til masserne og gør det endnu mere ineffektivt [7] .
reCAPTCHA er et projekt, der bruger et ulæseligt ord til OCR , som er et af de mange forvrængede fragmenter af scannede bøger, foruden et computergenereret ord, som et arbejdselement til brugersvar på en captcha-anmodningDenne service tager højde for brugsmetoder og muligheder for programmer til digitalisering af bogtekster . For pålidelighed tilbydes det samme ord til flere brugere af forskellige websteder. Når forskellige brugere giver det samme svar på en CAPTCHA-anmodning, antages de at have indtastet det rigtige ord.
Ordbøger og encyklopædier | |
---|---|
I bibliografiske kataloger |
|