Kredit:Depositphotos
Ett team av forskare från MIPT och Kazan National Research Technical University utvecklar en matematisk apparat som kan leda till ett genombrott inom nätverkssäkerhet. Resultaten av arbetet har publicerats i tidskriften Matematik .
Komplexa system, som nätverkstrafik eller levande organismer, har inte deterministiska fysiska lagar för att korrekt beskriva dem och förutsäga framtida beteende. I detta fall, en viktig roll spelas av korrelationsanalys, som beskriver systemets beteende i termer av uppsättningar av statistiska parametrar.
Sådana komplexa system beskrivs av trendlösa sekvenser, definieras ofta som långvariga tidsserier eller "brus". De är fluktuationer som produceras av en kombination av olika källor och är bland de svåraste data att analysera och extrahera tillförlitliga, stabil information.
En av de mått som används inom ekonomi och naturvetenskap i tidsserieanalys är Hurst-exponenten. Det antyder om trenden i data kommer att bestå:t.ex. om värdena kommer att fortsätta att öka, eller om tillväxten kommer att vända mot avtagande. Detta antagande gäller för många naturliga processer och förklaras av naturliga systems tröghet. Till exempel, sjönivåförändring, som överensstämmer med förutsägelser härledda från analys av Hurst-exponentvärdet, bestäms inte bara av den nuvarande mängden vatten, men också av avdunstningshastigheter, nederbörd, snösmältning, etc. Allt ovanstående är en tidskrävande process.
Fånga en cyberattack
Mängden trafik som passerar genom nätverksenheter är enorm. Detta gäller för slutenheterna – hemdatorer, men speciellt för mellanliggande enheter som routrar, såväl som servrar med hög volym. En del av denna trafik, som videokonferenser, måste skickas med högsta prioritet, medan du skickar filer kan vänta. Eller så är det kanske torrenttrafik som täpper till en smal kanal. Eller i värsta fall, det pågår en nätverksattack och den måste blockeras.
Trafikanalys kräver beräkningsresurser, lagringsutrymme (buffert) och tid – vad som ger latens vid överföring. Alla dessa är en bristvara, särskilt när det kommer till lågeffekts mellanliggande enheter. För närvarande, det är antingen relativt enkla maskininlärningsmetoder, som lider av bristande noggrannhet, eller metoder för djupa neurala nätverk, som kräver ganska kraftfulla datorstationer med stora mängder minne bara för att distribuera infrastrukturen att köra, än mindre själva analysen.
Tanken bakom arbetet i teamet av forskare ledd av Ravil Nigmatullin är ganska enkel:generalisera Hearst-exponenten genom att lägga till fler koefficienter för att få en mer fullständig beskrivning av de förändrade data. Detta gör det möjligt att hitta mönster i datan som vanligtvis betraktas som buller och som tidigare var omöjliga att analysera. På det här sättet, det är möjligt att extrahera betydande funktioner i farten och tillämpa rudimentära maskininlärningstekniker för att söka efter nätverksattacker. Tillsammans, de är mer exakta än tunga neurala nätverk, och tillvägagångssättet kan användas på mellanliggande enheter med låg effekt.
Buller kasseras vanligtvis, men att identifiera mönster i brus kan vara mycket användbart. Till exempel, forskarna har analyserat det termiska bruset från en sändare i ett kommunikationssystem. Denna matematiska apparat gjorde det möjligt för dem att från data isolera en uppsättning parametrar som kännetecknar en viss sändare. Detta kan vara en lösning på ett av kryptografiproblemen:Alice skickar meddelanden till Bob, Chuck är en inkräktare som försöker utge sig för att vara Alice och skicka ett meddelande till Bob. Bob måste skilja ett meddelande från Alice från ett meddelande från Chuck.
Datahantering tränger djupt in i alla områden av mänskligt liv, med bild- och taligenkänningsalgoritmer som sedan länge flyttat från science fiction-området till något vi möter dagligen. Denna beskrivningsmetod producerar signalfunktioner som kan användas i maskininlärning, avsevärt förenkla och påskynda igenkänningssystem och förbättra noggrannheten i beslut.
Alexander Ivchenko, en medlem av Multimedia Systems and Technology Laboratory vid MIPT, en av författarna till utvecklingen, säger:"Utvecklingen av denna matematiska apparat kan lösa frågan om parametrisering och analys av processer för vilka det inte finns någon exakt matematisk beskrivning. Detta öppnar för enorma möjligheter att beskriva, analysera och prognostisera komplexa system."