Nästa gräns för datalagring:DNA. Upphovsman:ymgerman/Shutterstock.com
Mänskligheten producerar data i en ofattbar takt, till den grad att lagringsteknik inte kan hänga med. Var femte år, mängden data vi producerar ökar tio gånger, inklusive foton och videor. Allt behöver inte lagras, men tillverkare av datalagring gör inte hårddiskar och flashchips tillräckligt snabbt för att hålla vad vi vill behålla. Eftersom vi inte kommer att sluta ta bilder och spela in filmer, vi måste utveckla nya sätt att rädda dem.
Under årtusenden, naturen har utvecklat ett otroligt informationslagringsmedium - DNA. Det utvecklades för att lagra genetisk information, ritningar för att bygga proteiner, men DNA kan användas för många fler ändamål än just det. DNA är också mycket tätare än moderna lagringsmedier:Data på hundratusentals DVD-skivor kan passa in i ett DNA-paket med tändsticksask. DNA är också mycket mer hållbart - varar tusentals år - än dagens hårddiskar, som kan pågå år eller decennier. Och medan hårddiskformat och anslutningsstandarder blir föråldrade, DNA kommer aldrig, åtminstone så länge det finns liv.
Tanken med att lagra digital data i DNA är flera decennier gammal, men det senaste arbetet från Harvard och European Bioinformatics Institute visade att framsteg i moderna DNA -manipulationsmetoder kan göra det både möjligt och praktiskt idag. Många forskargrupper, inklusive på ETH Zürich, University of Illinois i Urbana-Champaign och Columbia University arbetar med detta problem. Vår egen grupp vid University of Washington och Microsoft håller världsrekordet för mängden data som framgångsrikt lagras i och hämtas från DNA - 200 megabyte.
Förbereder bitar för att bli atomer
Traditionella medier som hårddiskar, tummenheter eller DVD -skivor lagrar digital data genom att antingen ändra den magnetiska, elektriska eller optiska egenskaper hos ett material för att lagra 0s och 1s.
För att lagra data i DNA, konceptet är detsamma, men processen är annorlunda. DNA -molekyler är långa sekvenser av mindre molekyler, kallas nukleotider - adenin, cytosin, tymin och guanin, brukar betecknas som A, C, T och G. Istället för att skapa sekvenser av 0s och 1s, som i elektroniska medier, DNA -lagring använder sekvenser av nukleotiderna.
Det finns flera sätt att göra detta, men den allmänna tanken är att tilldela digitala datamönster till DNA -nukleotider. Till exempel, 00 kan motsvara A, 01 till C, 10 till T och 11 till G. För att lagra en bild, till exempel, vi börjar med dess kodning som en digital fil, som en JPEG. Den filen är, i huvudsak, en lång sträng av 0s och 1s. Låt oss säga att de första åtta bitarna i filen är 01111000; vi delar dem i par-01 11 10 00-som motsvarar C-G-T-A. Det är i vilken ordning vi förenar nukleotiderna för att bilda en DNA -sträng.
Digitala datorfiler kan vara ganska stora - även terabyte i storlek för stora databaser. Men enskilda DNA -strängar måste vara mycket kortare - innehar bara cirka 20 byte vardera. Det beror på att ju längre en DNA -sträng är, desto svårare är det att bygga kemiskt.
Så vi måste dela upp data i mindre bitar, och lägg till var och en en indikator på var i sekvensen den faller. När det är dags att läsa den DNA-lagrade informationen, den indikatorn kommer att säkerställa att alla bitar av data stannar i rätt ordning.
Nu har vi en plan för hur data ska lagras. Därefter måste vi faktiskt göra det.
Lagra data
Efter att ha bestämt vilken ordning bokstäverna ska gå i, DNA -sekvenserna tillverkas bokstav för bokstav med kemiska reaktioner. Dessa reaktioner drivs av utrustning som tar i flaskor med A, C, G och T och blandar dem i en flytande lösning med andra kemikalier för att kontrollera reaktionerna som specificerar ordningen för de fysiska DNA -strängarna.
Denna process ger oss en annan fördel med DNA -lagring:säkerhetskopior. Istället för att göra en sträng i taget, de kemiska reaktionerna gör många identiska trådar på en gång, innan jag fortsätter att göra många kopior av nästa sträng i serien.
När DNA -strängarna väl skapats, vi måste skydda dem mot skador från fukt och ljus. Så vi torkar ut dem och lägger dem i en behållare som håller dem kalla och blockerar vatten och ljus.
Men lagrade data är bara användbara om vi kan hämta dem senare.
Läser tillbaka data
För att läsa data ur lagringsutrymmet, vi använder en sekvenseringsmaskin exakt som de som används för analys av genomiskt DNA i celler. Detta identifierar molekylerna, generera en bokstavssekvens per molekyl, som vi sedan avkodar till en binär sekvens av 0s och 1s i ordning. Denna process kan förstöra DNA:t när det läses - men det är där dessa säkerhetskopior spelar in:Det finns många kopior av varje sekvens.
Och om säkerhetskopiorna tar slut, det är lätt att göra kopior för att fylla på lagret - precis som naturen kopierar DNA hela tiden.
Just nu, de flesta DNA -hämtningssystem kräver läsning av all information som lagras i en viss behållare, även om vi bara vill ha en liten del av det. Det här är som att läsa en hel hårddisk information bara för att hitta ett e -postmeddelande. Vi har utvecklat tekniker-baserade på välstuderade biokemiska metoder-som låter oss identifiera och läsa endast den specifika information som en användare behöver för att hämta från DNA-lagring.
Återstående utmaningar
För närvarande, DNA -lagring är experimentell. Innan det blir vanligt, det måste vara helt automatiserat, och processerna för att bygga DNA och läsa det måste förbättras. De är båda benägna att göra fel och är relativt långsamma. Till exempel, dagens DNA -syntes låter oss skriva några hundra byte per sekund; en modern hårddisk kan skriva hundratals miljoner byte per sekund. Ett genomsnittligt iPhone -foto skulle ta flera timmar att lagra i DNA, även om det tar mindre än en sekund att spara på telefonen eller överföra till en dator.
Det här är betydande utmaningar, men vi är optimistiska eftersom all relevant teknik förbättras snabbt. Ytterligare, DNA -datalagring behöver inte den perfekta noggrannhet som biologin kräver, så forskare kommer sannolikt att hitta ännu billigare och snabbare sätt att lagra information i naturens äldsta datalagringssystem.
Denna artikel publicerades ursprungligen på The Conversation. Läs originalartikeln.