Universum av diskursregioner segregerade av FRS. Kredit:Zabihimayvan &Doran.
Under de senaste decennierna, nätfiskeattacker har blivit allt vanligare. Dessa attacker tillåter angripare att skaffa känslig användardata, som lösenord, användarnamn, kreditkortsuppgifter, etc., genom att lura människor att avslöja personlig information. Den vanligaste typen av nätfiskeattacker är e-postbedrägerier där användare förleds att tro att de behöver lämna sina uppgifter till en etablerad eller betrodd enhet, medan de är, faktiskt, dela denna data med någon annan.
IT-proffs har utvecklat ett stort antal verktyg och strategier för att upptäcka och förhindra nätfiskeattacker, många av dem är baserade på maskininlärning. Prestandan hos sådana maskininlärningsalgoritmer beror ofta på vilka funktioner de extraherar från webbplatser.
Forskare vid Wright State University har nyligen utvecklat en ny metod för att identifiera de bästa uppsättningarna funktioner för algoritmer för upptäckt av nätfiskeattacker. Deras tillvägagångssätt, beskrivs i en tidning som förpublicerats på arXiv, kan hjälpa till att förbättra prestandan hos individuella maskininlärningsalgoritmer för att avslöja nätfiskeattacker.
"Prestandan hos algoritmer för upptäckt av nätfiske som använder maskininlärning beror starkt på funktionerna på en webbplats som algoritmen överväger, inklusive längden på webbadressen eller om specialtecken som @ och bindestreck finns i webbadressen, " Mahdieh Zabihimayvan och Derek Doran, de två forskarna som genomförde studien, berättade för TechXplore via e-post. "I det här arbetet, vi ville göra det enklare att bygga maskininlärningsalgoritmer för nätfiskedetektering genom att automatiskt återställa en "bästa" uppsättning funktioner för alla nätfiskedetekteringsalgoritmer, oavsett vilken webbplats som övervägs."
Även om det nu finns flera algoritmer för att identifiera nätfiskeattacker, än så länge, mycket få studier har fokuserat på att fastställa de mest effektiva funktionerna för att upptäcka denna speciella typ av attack. I deras studie, Zabihimayvan och Doran tog upp denna lucka i litteraturen, genom att försöka hitta de mest effektiva funktionerna för just denna uppgift.
"Vi tillämpade teorin om Fuzzy Rough Set (FRS) som ett verktyg för att välja de mest effektiva funktionerna från tre benchmarkerade datauppsättningar för nätfiskewebbplatser, Zabihimayvan och Doran sa. "De valda funktionerna används sedan för tre ofta använda maskininlärningsalgoritmer för nätfiske-detektering."
För att testa effektiviteten och generaliserbarheten av deras FRS-funktionsvalsmetod, forskarna använde den för att träna tre vanligt använda klassificerare för upptäckt av nätfiske på en datauppsättning av 14, 000 webbplatsprover och sedan utvärderade deras prestanda. Deras utvärderingar gav mycket lovande resultat, nådde ett maximalt F-mått på 95 procent när deras funktionsvalsmetod tillämpades på en slumpmässig skog (RM) klassificerare.
"FRS upptäcker funktionsberoende baserat på data, Zabihimayvan och Doran förklarade. "Med andra ord, FRS bestämmer hur man separerar en uppsättning data baserat på deras funktionsvärden och etiketter med hjälp av en beslutsgräns och en likhetsrelation som deklareras i form av fuzzy medlemskapsfunktioner. Funktioner valda av FRS är de som kan skilja mer mellan dataprover som tillhör olika klasser."
FRS-metoden som användes av Zabihimayvan och Doran valde nio universella funktioner över alla datauppsättningar som användes i deras studie. Genom att använda denna universella funktionsuppsättning, de uppnådde ett F-mått på cirka 93 procent, vilket liknar det som uppnås av klassificerare som använder sin FRS-metod. Den universella funktionsuppsättningen innehåller inga funktioner från tredjepartstjänster, så detta fynd tyder på att man potentiellt skulle kunna upptäcka nätfiskeattacker snabbare utan förfrågan från externa källor.
"De funktioner som väljs automatiskt av FRS ger den bästa detekteringsprestanda över ett antal klassificerare, ", sa Zabihimayvan och Doran. "Vi hittar också en uppsättning 'universella funktioner' – de aspekter av en webbsida som FRS hittade för att bäst förutsäga om en sida försöker fiska information, oavsett vilken typ av webbplats sidan försöker efterlikna."
Studien utförd av Zabihimayvan och Doran är en av de första som ger värdefull insikt om de mest effektiva funktionerna för att upptäcka nätfiskeattacker. I framtiden, deras arbete skulle kunna bana väg för utveckling av mer effektiva och tillförlitliga tekniker för upptäckt av nätfiske, som skulle avslöja dessa attacker snabbare än nuvarande metoder.
F-mått för olika klassificerare och funktionsuppsättningar. Kredit:Zabihimayvan &Doran.
"Vi hoppas nu kunna utöka vår studie ytterligare genom att undersöka funktionsval för mer sofistikerade maskininlärningsalgoritmer, inklusive djupinlärningsarkitekturer som automatiskt upptäcker "metafunktioner" för att ytterligare förbättra detekteringsprestandan, Zabihimayvan och Doran sa. "Vi planerar också att utöka vårt ramverk för val av funktioner för att upptäcka nätfiske-e-post."
© 2019 Science X Network