Internet växer, men gammal information fortsätter att försvinna dagligen. Kredit:wk1003mike/shutterstock.com
Många MySpace-användare var bestörta när de upptäckte tidigare i år att den sociala medieplattformen förlorade 50 miljoner filer som laddades upp mellan 2003 och 2015.
MySpaces misslyckande att ta hand om och bevara användarnas innehåll bör tjäna som en påminnelse om att det kan vara riskabelt att förlita sig på gratis tredjepartstjänster.
MySpace har förmodligen bevarat användarnas data; det tappade bara innehållet. Uppgifterna var värdefulla för MySpace; användarnas innehåll mindre så.
Vad hände med MySpace
MySpace är en social mediasida där artister kan ladda upp musik eller annat innehåll för åtkomst och distribution till dess användargemenskap. Det har alltid varit en gratis sida, med intäkter från annonser och programmering som riktar sig till användare för specifika produkter.
Bildades 2003 i imitation av den sociala spelsajten Friendster, MySpace växte snabbt och köptes av Rupert Murdochs News Corporation 2005. År 2008 MySpace var den ledande webbplatsen för sociala nätverk, Värderat en gång till 12 miljarder USD, men det minskade i popularitet – tack vare en överprevalens av annonser, oro över exponering av minderåriga för sexuellt innehåll och andra frågor. Under 2011, News Corporation sålde MySpace till specifika media, som sålde den igen 2016 till Time Inc., som i sin tur köptes av Meredith Corporation 2018.
Så företaget gick igenom tre ägarbyten under en 12-årsperiod, och såg intäkter och medlemskap sjunka hastigt under den tiden. En försäljning kan vara bra, men tre försäljningar på kort sikt tyder för mig på en orolig verksamhet som inte var i ett bra läge att vaka över andras immateriella rättigheter.
Alla som använder MySpace som en lagringstjänst som inte hade alternativ backup har helt enkelt tur. Du lämnade din immateriella egendom sittande bredvid informationsmotorvägen, och när du kom tillbaka 10 år senare var det borta.
MySpace är inte ensam om att stöta på problem. Amazons molntjänster, till exempel, upplevde också ett betydande avbrott 2011 och ytterligare ett 2017. Även om det var tillfälligt, och utan faktisk förlust av data, dessa avbrott lämnade användare utan tillgång till värdefulla och viktiga filer under en tid.
Ett mycket större problem
Att bevara innehåll eller immateriella rättigheter på internet utgör en gåta. Om det är tillgängligt, då är det inte säkert; om det är säkert, då är den inte tillgänglig.
Tillgängligt innehåll kan manipuleras, stöld eller andra slags dåliga handlingar. Endast innehåll som är otillgängligt kan låsas och skyddas från hackning.
Internet har för närvarande åtkomst till cirka 15 zettabyte data, och växer med en hastighet av 70 terabyte per sekund. Det är visserligen ett läckande kärl, och innehåll går ständigt offline för att sluta förlora för alltid.
I ett påstående, Myspace sa, "Vi ber om ursäkt för besväret." Kredit:chrisdorney/shutterstock.com
Massiva och desperata ansträngningar pågår för att bevara det som är värt att bevara, men även att reda ut vad som är och inte är är i sig ett formidabelt företag. Vad kommer att vara av värde om 10 år – eller 50 år? Och hur bevarar man det?
Syrafritt papper kan hålla i 500 år; steninskrifter ännu längre. Men magnetiska media som hårddiskar har en mycket kortare livslängd, varar bara tre till fem år. De måste också kopieras och verifieras under en mycket kort livscykel för att undvika dataförsämring vid observerade felfrekvenser mellan 3 % och 8 % årligen.
Sedan finns det också ett problem med bevarande av programvara:Hur kan människor idag eller i framtiden tolka de där WordPerfect- eller WordStar-filerna från 1980-talet, när de ursprungliga mjukvaruföretagen har slutat stödja dem eller gått i konkurs?
En ideell startup som heter The Internet Archive bevarar ögonblicksbilder av webben fortlöpande, men mestadels är detta för offentliga HTML-webbsidor på toppnivå som The New York Times webbplats och Facebook, inte för underliggande innehållsfiler. Från och med i höstas, dess Wayback Machine rymde över 450 miljarder sidor i 25 petabyte data. Detta skulle representera 0,0003 % av det totala internet.
universitet, regeringar och vetenskapliga sällskap kämpar för att bevara vetenskapliga data i ett myller av arkiv, såsom Storbritanniens Digital Preservation Coalition, MetaArkiv, eller det nu upplösta samarbetet Digital Preservation Network. bevarande är svårt och dyrt i tid, pengar och utrustning. För att vara mest användbar, det måste inte bara förvaras, men värd i en form som är tillgänglig och tillgänglig för framtida återanvändning.
Faktisk lagring kostar mindre än 0,05 USD per gigabyte, men lagring är bara en liten andel av kostnaderna för konservering. Förvärv, nätverk, underhåll och administration kräver avsevärt och kostsamt mänskligt arbete.
Budgetmodeller föreslår en 10-årig bevarandekostnad på cirka 2,50 USD per gigabyte, eller $2, 500 per terabyte, eller $625, 000 för filerna som MySpace misslyckades med att bevara.
Med tanke på dina egna uppgifter
Så ja, Internet ruttnar, men arkivarier och digitala bibliotekarier som jag visste att det redan var ruttet, liksom alla som någonsin fått felet "404-filen hittades inte".
Där det finns ekonomiska incitament att behålla och använda data – såsom användarinformation, profiler eller surfhistorik - det kan finnas ganska länge. Det har sagts av många att data är den nya oljan, och företag är angelägna om att borra och utnyttja denna resurs.
Dock, där innehåll är mindre värt för den som äger servrarna, det finns mindre incitament att investera i att bevara den. En undersökning av 10 miljoner träffar från 25 slumpmässiga webbplatser 2004 tyder på att 404-fel inträffar på nära 3 % av riktade webbadresser. Internet växer mycket snabbare än det ruttnar, men båda sakerna händer på en gång. Inget gigantiskt internetföretag har dina intressen närmare sitt hjärta än sina egna.
Ett bevarandenätverk är känt under förkortningen LOCKSS – Lots of Copies Keeps Stuff Safe – och det är en bra tumregel. Ha alltid en backup, och alltid ha flera säkerhetskopior. Bevaka din integritet och skydda ditt innehåll, åtminstone det innehåll du kanske vill ha bevarat, gillar bilder, e-post, det där manuset eller romanen, eller video- och musikfiler. Upphovsrättsreglerna förbjuder inte lagring av innehåll som du kan ha köpt, så länge du inte lägger ut det för offentlig delning.
Gratis lagring är ett bra erbjudande, men ibland får du bara vad du betalar för. Internet är varken säkert eller permanent. Det har aldrig lovat att bli, och användare ska inte anta att det kommer att bli så. Delar ruttnar och korroderar och kollapsar när jag skriver detta. Bara hoppas och planerar att inte vila på den plattformen när den faller.
Denna artikel publiceras från The Conversation under en Creative Commons -licens. Läs originalartikeln.