Upphovsman:CC0 Public Domain
Forskare har skapat ny artificiell intelligens som kan stava slutet för ett av de mest använda webbplatsens säkerhetssystem.
Den nya algoritmen, baserat på djupa inlärningsmetoder, är den hittills mest effektiva lösningen av captcha -säkerhets- och autentiseringssystem och kan besegra versioner av text -captcha -system som används för att försvara majoriteten av världens mest populära webbplatser.
Textbaserade captcha använder ett virvar av bokstäver och siffror, tillsammans med andra säkerhetsfunktioner som till exempel blockerade linjer, att skilja mellan människor och skadliga automatiserade datorprogram. Det är beroende av att människor tycker att det är lättare att dechiffrera karaktärerna än maskiner.
Utvecklad av datavetenskapare vid Lancaster University i Storbritannien samt Northwest University och Peking University i Kina, lösaren levererar betydligt högre noggrannhet än tidigare captcha -attacksystem, och kan framgångsrikt knäcka versioner av captcha där tidigare attacksystem har misslyckats.
Lösaren är också mycket effektiv. Det kan lösa en captcha inom 0,05 sekunder med en stationär dator.
Det fungerar med hjälp av en teknik som kallas ett 'Generativt kontradiktoriskt nätverk', eller GAN. Detta innebär att man lär ett captcha -generatorprogram för att producera ett stort antal utbildningscaptchaer som inte går att skilja från äkta captchas. Dessa används sedan för att snabbt träna en lösare, som sedan förädlas och testas mot riktiga captchas.
Genom att använda en maskininlärd automatisk captcha-generator, forskarna, eller skulle vara angripare, kan minska ansträngningen avsevärt, och tid, behövs för att manuellt hitta taggar för att träna sin programvara. Det kräver bara 500 äkta captchas, istället för de miljoner som normalt skulle behövas för att effektivt träna ett attackprogram.
Tidigare captcha -lösare är specifika för en viss captcha -variant. Tidigare maskininlärningssystem är arbetskrävande att bygga, kräver mycket manuell märkning av captchas för att träna systemen. De blir också lätt föråldrade av små förändringar i säkerhetsfunktionerna som används inom captchas.
Eftersom den nya lösaren kräver lite mänskligt engagemang kan den enkelt byggas om till nya, eller modifierad, captcha -scheman.
Programmet testades på 33 captcha -scheman, varav 11 används av många av världens mest populära webbplatser - inklusive eBay, Wikipedia och Microsoft.
Dr Zheng Wang, Universitetslektor vid Lancaster University's School of Computing and Communications och medförfattare till forskningen, sade:"Det här är första gången ett GAN-baserat tillvägagångssätt har använts för att konstruera lösare. Vårt arbete visar att de säkerhetsfunktioner som används av de nuvarande textbaserade captcha-systemen är särskilt sårbara under djupa inlärningsmetoder.
"Vi visar för första gången att en motståndare snabbt kan starta en attack mot ett nytt textbaserat captcha-system med mycket låg ansträngning. Detta är skrämmande eftersom det betyder att detta första säkerhetsförsvar för många webbplatser inte längre är tillförlitligt. Det betyder captcha öppnar upp en enorm säkerhetsproblem som kan utnyttjas av en attack på många sätt.
Herr Guixin Ye, den ledande studentförfattaren till verket sa:"Det tillåter en motståndare att starta en attack mot tjänster, såsom Denial of Service -attacker eller spenderar skräppost eller fiskemeddelanden, att stjäla personuppgifter eller till och med förfalska användaridentiteter. Med tanke på den höga framgångsgraden för vårt tillvägagångssätt för de flesta text -captcha -scheman, webbplatser borde överge captchas. "
Forskare tror att webbplatser bör överväga alternativa åtgärder som använder flera säkerhetslager, till exempel en användares användningsmönster, enhetens plats eller till och med biometrisk information.
Forskningen publiceras i tidningen 'Yet Another Text Captcha Solver:A Generative Adversarial Network Based Approach' som presenterades vid ACM Conference on Computer and Communications Security (CCS) 2018 i Toronto.