• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • ShareBackup kunde hålla data i snabbfilen

    Rice Universitys datavetare Eugene Ng ledde utvecklingen av ShareBackup, en hård- och mjukvarulösning som hjälper datacenter att återhämta sig från fel utan att sakta ner applikationer. Kredit:Jeff Fitlow/Rice University

    Alla som någonsin har förbannat ett datornätverk när det saktade ner till en genomsökning kommer att uppskatta det botemedel som forskare vid Rice University erbjuder.

    Rice datavetare Eugene Ng och hans team säger att deras lösning kommer att hålla data på snabbspåret när misslyckanden oundvikligen inträffar.

    Ng introducerade ShareBackup, en strategi som skulle tillåta delade backup-switchar i datacenter att ta på sig nätverkstrafik inom en bråkdel av en sekund efter ett fel på mjukvara eller hårdvara.

    Han kommer att presentera ett refereegranskat papper om arbetet denna vecka vid SIGCOMM 2018-konferensen i Budapest, Ungern. Tidningen är online och tillgänglig för nedladdning.

    Ng sa att idén skulle lösa en vanlig irritation bland dataproffs, forskare och alla som förlitar sig på ett nätverk för att leverera resultat dag ut och dag in.

    "Ett datanätverk består av servrar och nätverksväxlar, sa Ng, professor i datavetenskap och el- och datateknik. "Switchar flyttar datapaket dit de behöver gå. Men saker misslyckas, speciellt i storskaliga datacenter med tusentals hårdvara."

    Det vanliga svaret på en misslyckad switch är att shunta dataflödet till en annan linje. "Rent generellt, nätverket har flera vägar för att ansluta servrar så, precis som om det är en avstängning på motorvägen, vi skulle köra runt den. Detta är en konventionell, naturligt tillvägagångssätt som är mycket vettigt:du omdirigerar runt misslyckandet att komma dit du behöver gå."

    Men ibland är den andra vägen överbelastad och allt saktar ner. "Datacenter är inte internet, de handlar inte om att människor surfar på webbplatser, ", sa Ng. "De handlar om att stödja dataintensiva applikationer som datautvinning eller maskininlärning. Och många av dessa applikationer har stränga prestandadeadlines, så att blint omdirigering av trafik kan vara fel sak att göra i ett datacenter."

    Istället för det dyra alternativet att installera redundanta switchar i ett nätverk, Ng-labbets strategi skulle placera snabba switchar och mjukvara på strategiska platser som kunde ta upp trafiken från en misslyckad switch på en mikrosekund. När det problemet är löst, teamets programvara gör backup-switchen tillgänglig för att hantera ett annat fel.

    Omkopplaren är tillräckligt snabb – felåterställningstiden är 0,73 millisekunder, inklusive latens från hårdvara och kontrollsystem – att de flesta användare aldrig skulle veta att en del av systemet hade misslyckats.

    "Verkligheten är att andelen enheter som misslyckas vid en given tidpunkt är mycket liten, och de flesta av dessa fel kan åtgärdas genom saker som att starta om enheten, "Ng sa. "Ibland blir mjukvaran skruvad och en enkel strömcykel kommer att ta tillbaka den. Dessa misslyckanden kanske inte heller varar länge.

    "Det här är egenskaperna vi försöker utnyttja, " sade han. "På grund av det, vi kan komma undan med att ha väldigt få enheter säkerhetskopiera ett stort antal enheter."

    Ng sa att ShareBackup skulle kunna spara tid och pengar för datacenter inte bara genom att upprätthålla full bandbredd utan genom att också hjälpa till att analysera problem, inklusive felkonfigurationer som vanligtvis leder till nätverksfel.

    "En del av vårt arbete är att hjälpa datacenter att ta reda på vad som gick fel i nätverket, " sa han. "När säkerhetskopieringen är aktiverad, du kan ta ut den trasiga enheten ur produktionsnätverket och testa den för att identifiera vilken komponent som orsakade problemet.

    "Nu, om vi tar ut två enheter och inte kan ta reda på vilken som gick dåligt, båda måste bytas ut, " sa han. "Det är mycket troligt att bara en av enheterna har problemet. Vår programvara kan diagnostisera dessa enheter på ett halvautomatiskt sätt, och om en av delarna är bra, den kan återställas."


    © Vetenskap https://sv.scienceaq.com