I ett proof of concept-test för Project Silica, Microsoft och Warner Bros. har framgångsrikt lagrat och läst tillbaka den klassiska "Superman"-filmen från 1978 på ett 7,5 cm x 7,5 cm x 2 mm stycke av hållbart kiselglas - ungefär lika stor som ett glasunderlägg. Glaset innehåller 75,6 GB data plus felredundanskoder. Kredit:Jonathan Banks för Microsoft.
Microsoft och Warner Bros. har samarbetat för att framgångsrikt lagra och hämta hela den ikoniska "Superman"-filmen från 1978 på en glasbit som är ungefär lika stor som en drinkunderlägg, 75 gånger 75 gånger 2 millimeter tjock.
Det var det första proof of concept-testet för Project Silica, ett Microsoft Research-projekt som använder nya upptäckter inom ultrasnabb laseroptik och artificiell intelligens för att lagra data i kvartsglas. En laser kodar data i glas genom att skapa lager av tredimensionella gitter i nanoskala och deformationer i olika djup och vinklar. Maskininlärningsalgoritmer läser tillbaka data genom att avkoda bilder och mönster som skapas när polariserat ljus lyser genom glaset.
Det hårda kiselglaset tål att kokas i varmt vatten, bakade i ugn, mikrovågsugn, översvämmad, skurat, avmagnetiserade och andra miljöhot som kan förstöra ovärderliga historiska arkiv eller kulturskatter om det går fel.
Det representerar en investering från Microsoft Azure för att utveckla lagringsteknologier som är byggda specifikt för molnberäkningsmönster, snarare än att förlita sig på lagringsmedia utformade för att fungera i datorer eller andra scenarier. Det är bara ett av många sätt som Azure förlitar sig på Microsofts forskningsexpertis för att lösa både kortsiktiga och långsiktiga utmaningar – från Project Naticks undervattensdatacentertest till Project Brainwaves FPGA-processorkraft och den framväxande Optics for the Cloud-forskningen.
"Att lagra hela 'Superman'-filmen i glas och kunna läsa upp den framgångsrikt är en stor milstolpe, sa Mark Russinovich, Azures tekniska chef. "Jag säger inte att alla frågor har besvarats helt, men det ser ut som att vi nu är i en fas där vi arbetar med förfining och experiment, ställer istället frågan "kan vi göra det?"
Warner Bros., som vände sig till Microsoft efter att ha lärt sig forskningen, är alltid på jakt efter ny teknik för att skydda sitt stora tillgångsbibliotek:historiska skatter som "Casablanca, "1940-talets radioprogram, animerade shorts, digitalt inspelade teaterfilmer, tv sitcoms, dagstidningar från filmuppsättningar. I åratal, de hade letat efter en lagringsteknik som kunde hålla i hundratals år, tål översvämningar eller solflammor och det kräver inte att den hålls vid en viss temperatur eller behöver konstant uppfräschning.
"Det hade alltid varit vår ledstjärna för hopp om vad vi trodde skulle vara möjligt en dag, så när vi fick veta att Microsoft hade utvecklat denna glasbaserade teknik, vi ville bevisa det, " sa Warner Bros. Chief Technology Officer Vicky Colf.
Drar ner kostnaderna för långtidslagring
De flesta tänker på "molnet" som ett sätt att lagra allt från tusentals familjefoton till miljontals e-postmeddelanden utan att ta upp utrymme på din telefon eller dator. Men all den informationen lagras fysiskt på hårdvara på en avlägsen plats, så att du kan komma åt den från flera enheter.
Mängden data som mänskligheten nu vill lagra – från medicinska journaler till roliga kattvideor till bilder tagna med rymdfarkoster – exploderar samtidigt som kapaciteten hos befintlig lagringsteknik planar ut.
Microsofts senior optikforskare James Clegg laddar en bit glas i ett system som använder optik och artificiell intelligens för att hämta och läsa data lagrade på glas. Kredit:Jonathan Banks för Microsoft.
Långsiktiga lagringskostnader drivs upp av behovet av att upprepade gånger överföra data till nyare media innan informationen går förlorad. Hårddiskar kan slitas ut efter tre till fem år. Magnettejp får bara vara fem till sju. Filformat blir föråldrade, och uppgraderingar är dyra. I sina egna digitala arkiv, till exempel, Warner Bros. migrerar proaktivt innehåll vart tredje år för att ligga steget före försämringsproblem.
Glaslagring har potential att bli ett billigare alternativ eftersom du bara skriver in data på glaset en gång. Femtosekundlasrar – sådana som avger ultrakorta optiska pulser och som ofta används vid LASIK-kirurgi – ändrar permanent glasets struktur, så data kan bevaras i århundraden.
Kvartsglas behöver inte heller energikrävande luftkonditionering för att hålla materialet vid en konstant temperatur eller system som tar bort fukt från luften - som båda kan sänka miljöavtrycket av storskalig datalagring.
"Vi försöker inte bygga saker som du lägger i ditt hus eller spela upp filmer från. Vi bygger lagring som fungerar i molnskala, sa Ant Rowstron, partner biträdande labbchef för Microsoft Research Cambridge i Storbritannien, som samarbetade med University of Southampton för att utveckla Project Silica.
"En stor sak vi ville eliminera är denna dyra cykel av att flytta och skriva om data till nästa generation. Vi vill verkligen ha något du kan lägga på hyllan för 50 eller 100 eller 1, 000 år och glöm det tills du behöver det, " sa Rowstron.
Project Silica syftar till att lagra så kallade "kalla" data – arkivdata som kan ha ett enormt värde eller som företag måste underhålla – men som inte behöver nås ofta. Det kan inkludera medicinska uppgifter som måste sparas under en patients hela liv, uppgifter om finansiell reglering, juridiska avtal, geologisk information som hänför sig till energiutforskning och byggplaner som städer måste hålla fast vid.
Warner Bros. var mycket intresserad av att hjälpa Microsoft att testa lösningar som kan lindra kostnaderna och ineffektiviteten i samband med att lagra data över dessa långa tidshorisonter, sa Colf.
"Med det största innehållsbiblioteket i medie- och underhållningsbranschen i många mått, våra utmaningar är unika i sin omfattning, men de är verkligen inte unika när det gäller problemet vi försöker lösa, " Hon sa.
Förvandla digital data till fysiska artefakter
Med en nästan 100-årig historia inom film och tv, Warner Bros. äger ett av världens djupaste och mest betydelsefulla underhållningsbibliotek. Att återsläppa äldre filmer i nya format eller för ny publik är en viktig del av verksamheten. Det är också ett enormt kulturellt ansvar att bevara några av världens mest älskade berättelser i evighet, sa Colf.
"Föreställ dig om en titel som "Trollkarlen från Oz" eller en show som "Vänner" inte var tillgänglig för generation efter generation att njuta av och se och förstå, " sa hon. "Vi tycker att det är otänkbart, och det är därför vi tar jobbet med att bevara och arkivera vårt innehåll på största allvar."
Företaget har redundanta planer på plats för att hantera flera värsta scenarier:en jordbävning eller orkan som slår mot en av kusterna, en brand där dämpningssystemen inte slår in eller ett klimatkontrollfel som gör att fukt kan byggas upp och förstöra filmlager.
Målet är att ha tre arkivkopior av varje tillgång lagrade på olika platser runt om i världen:två separata digitaliserade kopior, tillsammans med den fysiska originalkopian på vilket medium en film eller tv-avsnitt eller tecknad serie skapades.
Lyckligtvis, originalfilmnegativ kommer att hålla i århundraden om de förvaras under rätt förhållanden. Men för vissa äldre tv-program - tänk avsnitt av "Alice" som spelades in på 1970-talet - har den ursprungliga fysiska kopian en begränsad hållbarhet som kräver migrering till nyare format. Och för dagens filmer och tv-program som spelas in digitalt, det tredje exemplaret av arkivkvalitet har en mycket kort migreringscykel på tre till fem år, som är utmanande att hantera.
"Låt oss säga att ett TV-program trycker direkt in i våra digitala arkiv, det finns inget fysiskt, sa Steven Anastasi, Warner Bros. vice VD för globala mediearkiv och bevarandetjänster. "Den digitala filen går in men jag har inget jag kan lägga i ett valv eller i en saltgruva eller något fysiskt som kommer in i byggnaden."
Warner Bros. tittar potentiellt på Project Silica för att skapa en permanent fysisk tillgång för att lagra viktigt digitalt innehåll och tillhandahålla hållbara säkerhetskopior. Just nu, för biopremiärer som spelas in digitalt, företaget skapar en tredje arkivkopia genom att konvertera den tillbaka till analog film. Den delar upp den slutliga filmen i tre färgkomponenter — cyan, magenta och gult – och överför var och en till svartvita filmnegativ som inte bleknar som färgfilm.
De negativen läggs i ett frysarkiv. I dessa välskötta valv, temperatur och luftfuktighet kontrolleras noggrant, och luftsniffer letar efter tecken på kemisk nedbrytning som kan signalera problem. Om de behöver filmen tillbaka, de måste vända de komplicerade stegen.
Den processen är dyr, och det finns bara en handfull filmlabb kvar i världen som kan göra det. Och processen är inte optimal ur en kvalitativ synvinkel, sa Brad Collar, Warner Bros. senior vice president för globala arkiv och mediateknik.
"När vi fotograferar något digitalt - med nollor och ettor som representerar pixlarna på skärmen - och skriver ut det till ett analogt medium som kallas film, du förstör de ursprungliga pixelvärdena. Och, Säker, det ser ganska bra ut, men det är inte reversibelt, " sa Collar.
"Om vi kan ta den digitala representationen av dessa pixlar och lägga den på ett medium som kiseldioxid och läsa tillbaka det exakt som det var när det kom ut ur kameran, vi har gjort vårt bevarandejobb efter bästa förmåga. Det är det jag älskar med det här, " han sa.
Brad Collar, Warner Bros. senior vice VD för globala arkiv och mediateknik, vänster, och Vicky Colf, Warner Bros. tekniska chef, demonstrera kontrasten mellan att lagra filmer på 22 filmrullar jämfört med en glasbit i glasunderlägg. Kredit:John Brecher för Microsoft.
Det är inte ekonomiskt att skapa arkivfilmnegativ för varje digitalt inspelat tv-avsnitt i Warner Bros.-biblioteket. Företaget hoppas att Project Silica kan visa sig vara ett billigare, högre kvalitet alternativ för att skapa fysiska arkiv av digitalt innehåll.
Det finns mycket mer arbete framför sig för att nå den skalan – Microsofts forskare skulle behöva öka hastigheten med vilken data kan skrivas och läsas avsevärt, såväl som dess densitet. Warner Bros. föreställer sig sin egen infrastruktur för att läsa data från glasarkiven. Men båda parter ser lovande i hur långt de har kommit.
"Om Project Silicas lagringslösning visar sig vara så kostnadseffektiv och skalbar som den skulle kunna vara – och vi alla inser att det fortfarande är tidiga dagar – är det här något vi skulle älska att se adopteras av andra studior och våra kamrater och andra industrier, sa Colf.
"Om det fungerar för oss, vi är övertygade om att detta kommer att vara en fördel för alla som vill bevara och arkivera innehåll, " Hon sa.
Designa lagring för molnet
Det är omöjligt att veta hur mycket information som har gått förlorad eftersom ingen insåg dess värde vid den tiden – från stumfilmer som ingen trodde någonsin skulle ses utanför en teater till historisk data som moderna analysverktyg och AI kan få nya insikter från.
Ett mål för Microsofts nästa generations lagringsforskning, som inkluderar parallella ansträngningar att lagra data i DNA, är att utveckla lösningar som är tillräckligt billiga och lätta att du egentligen inte behöver göra ett val om du vill lagra din data, säger företaget.
Microsofts forskare ägnade år åt att försöka nå dit med teknik som för närvarande används i datacenter. Men storleken, form och begränsningar för saker som att spola band och snurrande skivor – som alla uppfanns för andra ändamål långt innan molnet existerade – kunde helt enkelt inte få dem de vinster de ville ha.
"Så småningom, vi tänkte bara 'kan vi bygga något från grunden för molnet som inte behöver göra något annat?'" sa Rowstron.
De lanserade ett samarbete med University of Southampton Optoelectronic Research Centre, där forskare ursprungligen visade hur man lagrar data i glas med femtosekundlasrar. Med investering från Azure, Microsofts Cambridge, STORBRITANNIEN, lab byggde ett tvärvetenskapligt team av fysiker, optikexperter, elektroingenjörer och forskare med lagringsbakgrund för att driva tekniken vidare.
Microsoft Project Silica-forskaren Youssef Assaf tappar en fyrkant av kiseldioxidglas i en vattenkokare med kokande vatten för att visa dess hållbarhet. Teamet har bakat, kokt, mikrovågsugn, avmagnetiserade och skurade liknande glasbitar med stålull — utan att förlora data som lagras inuti. Kredit:Jonathan Banks för Microsoft.
Sedan dess, Microsoft Research-teamet har uppnått dramatiska framsteg i hastighet och precision. De har också arbetat nära sina Azure-motsvarigheter för att designa Project Silica med de dagliga utmaningarna och kraven för kommersiell molnlagring i åtanke.
"Att få alla deras input och tänkande i projektet från dag 1 betyder att vi kommer att generera något i slutet som verkligen är användbart för dem, " Rowstron sa om relationen med Azures produktteam.
Project Silicas infraröda lasrar kodar data i "voxels, " den tredimensionella motsvarigheten till pixlarna som utgör en platt bild. Till skillnad från andra optiska lagringsmedier som skriver data på ytan av något, Project Silica lagrar data i själva glaset. En 2 mm tjock glasbit, till exempel, kan innehålla mer än 100 lager av voxlar.
Data kodas i varje voxel genom att ändra styrkan och orienteringen av intensiva laserpulser som fysiskt deformerar glaset. Det är ungefär som att skapa upp och nervända isberg på nanoskalanivå, med olika djup och storlekar och spår som gör dem unika.
För att läsa tillbaka data, maskininlärningsalgoritmer avkodar mönstren som skapas när polariserat ljus lyser genom glaset. Till skillnad från bandlagring – som tar tid att spola för att komma till den plats du vill läsa tillbaka – kan algoritmerna snabbt nollställa någon punkt inom glasrutan, potentiellt minska fördröjningen för att hämta information.
"Om du är gammal nog att komma ihåg att spola tillbaka och vidarebefordra låtar på kassettband, det kan ta ett tag att komma till den del du vill ha, sa Richard Black, Microsofts främsta forskningsprogramvaruingenjör. "Däremot det går väldigt snabbt att läsa tillbaka från glas eftersom du kan röra dig samtidigt inom x- eller y- eller z-axeln."
Till skillnad från ömtåliga vinglas eller glödlampor, kvadraterna av kvartsglas som används för datalagring är förvånansvärt svåra att förstöra. Tidigt på, forskargruppen försökte baka en i en ugn vid 500 grader, mikrovågsugn, koka det, skura den med stålull. Och när de läser tillbaka data, allt fanns kvar.
Det var helt vettigt för Warner Bros. arkivarier, som för år sedan upptäckte lådor med Superman-radioserier inspelade på 1940-talet på rekordstora glasbitar.
"Vi hittade faktiskt spelare som vi kunde spela dessa saker tillbaka på, och de var lika bra eftersom de förvarades på glas. Och vi kunde digitalisera och spara dessa underbara delar av innehåll, " sa Collar.
"Så nu är en av våra äldsta tillgångar i vårt valv glas och en av de nyaste teknologierna i vårt valv är glas. Och de är båda Stålmannen. Så vi har verkligen kommit en runda, " han sa.