Ett exempel på tweets som inspirerade forskningsstudien. Kredit:Zhang et al.
Distributed Denial of Service (DDoS)-attacker, som är utformade för att förhindra legitima användare från att komma åt specifika nätverkssystem, har blivit allt vanligare under det senaste decenniet eller så. Dessa attacker gör att tjänster som Facebook, Reddit och nätbanksajter är extremt långsamma eller omöjliga att använda på grund av att nätverks- eller serverresurser tar slut (t.ex. bandbredd, CPU och minne).
Forskare över hela världen har försökt utveckla tekniker för att förhindra DDoS-attacker eller snabbt ingripa för att minska deras negativa effekter. Ett viktigt steg för att motverka sådana attacker är att snabbt samla in feedback från användare för att fastställa deras inverkan och komma med riktade lösningar.
Med detta i åtanke, ett team av forskare vid University of Maryland har utvecklat en maskininlärningsmodell som kan hjälpa till att bestämma omfattningen av effekten av DoS-attacker när de sker baserat på tweets som lagts upp av användare. Deras studie, nyligen förpublicerad på arXiv, finansierades av ett UMBC-USNA Cyber Innovation Grant.
"Forskningen baserades på observationen att när det finns svårigheter att få tillgång till nätverkstjänster, kunder delar ibland den informationen på sociala nätverk, "Dr Tim Oates, en av forskarna som genomförde studien, berättade för TechXplore. "Vårt huvudsakliga mål var att utveckla ett system som spårar nätverksattacker med denial-of-service (DoS) genom att analysera deras ringeffekter genom inlägg på sociala medier."
Till att börja med, Dr. Oates och hans kollegor samlade en sammanställd uppsättning tweets om DoS-attacker baserat på en historisk tidslinje över attacker som inträffade tidigare. När du tittar på dessa tweets, där användare beskrev problemen de upplevde under en attack, forskarna kunde identifiera "språkmönster" (dvs. relevanta sökord). De tränade sedan en klassificerare för beslutsträd för att upptäcka DDoS-attacker baserat på dessa nyckelord.
"Vi antog att drabbade kunder använder liknande språk på sociala medier för att beskriva problem under en DDoS-attack som att systemet eller produkten är långsam eller kryper, "Chi Zhang, en annan forskare som var involverad i studien berättade för TechXplore. "Således, när nya tweets samlas in (historiskt eller i realtid), modellen tar först reda på ämnena (en uppsättning nyckelord som brett definierar ett diskussionsområde) för de tweets som samlats in under det tidsfönstret."
Senare, klassificeraren utvecklad av Dr. Oates, Zhang och deras kollegor rangordnar tweetarna baserat på hur mycket nyckelorden skilde sig från språkmönster som observerats i användarinlägg under tidigare DDoS-attacker. Till sist, modellen använder antalet upptäckta DDos-relaterade tweets för att beräkna omfattningen av effekten av en attack.
När forskarna utvärderade sin modell, de fann att det uppnådde liknande resultat som övervakade toppmoderna metoder för att bestämma omfattningen av DDoS-attacker. En stor fördel med deras klassificerare, dock, är att den är svagt övervakad, det kräver därför mycket lite mänsklig märkning av träningsdata.
"Vi kunde utveckla en svagt övervakad modell för ny händelsedetektering som fungerar nästan lika bra som övervakade modeller, ", sade Zhang. "Dess svagt övervakade natur innebär att endast en liten mängd mänsklig märkt data behövs, så det sparar mycket resurser i form av mänskligt arbete, eftersom det vanligtvis är ganska dyrt att be folk att kommentera potentiellt tusentals tweets."
I framtiden, deras svagt övervakade modell skulle kunna hjälpa till att fastställa omfattningen av DDoS-attacker snabbt och mer effektivt, enbart baserat på Twitter-data. Det kan också anpassas och tillämpas på andra uppgifter som kan dra nytta av analysen av användarens tweets i realtid.
I sina nästa studier, forskarna planerar att utveckla sin modell ytterligare för att analysera tweets skrivna på andra språk. Så småningom, de skulle också vilja ändra dess klassificeringsskikt för att testa dess prestanda när det gäller att bestämma omfattningen av påverkan av andra typer av händelser, som sjukdomsutbrott (t.ex. ebola).
"Vi insåg att människor har många sätt att beskriva problem på Twitter, "Ashwinkumar Ganesan, en annan forskare som utförde studien, berättade för TechXplore. "Därav, det finns ett behov av att bygga en större cache av tweets och bättre modeller som hanterar denna variation i språket. Dessutom, attacker är inte begränsade till mål i den engelsktalande världen, så att designa systemet så att det kan skalas till andra språk är också mycket viktigt."
© 2019 Science X Network