Nieuws

Hardeschijven ssds

De toekomst van data-opslag? DNA-cassette bewaart bestanden mogelijk duizenden jaren

Portret van de auteur


De toekomst van data-opslag? DNA-cassette bewaart bestanden mogelijk duizenden jaren
2

Advertentie

Onderzoekers van de Southern University of Science and Technology (SUSTech) en Shanghai Jiao Tong Universityhebben een werkend prototype gebouwd van een DNA-cassettetape-drive. De set-up combineert DNA-opslag met een fysiek tape-medium en een compacte, doorzoekbare drive—een poging om de duurzaamheid van DNA te koppelen aan de schaalbaarheid van klassieke tape-bibliotheken.

Gegevens worden gecodeerd in synthetische DNA-strengen, op een flexibele film gedeponeerd en in een cartridgeopgeslagen die je kunt laden en laten ‘spoelen’ zoals bij magneetband. In theorie levert dit petabytes-per-meter dichtheid en een levensduur van eeuwen op. In de proof-of-concept lukte het echter slechts om één bestand van 156,6KB te schrijven; uitlezen kostte ~25 minuten, opnieuw schrijven ~50 minuten. De echte bottleneck is dus synthese en sequencing; mechanisch kan de drive snel naar de juiste positie seeken, maar de moleculaire stappen gaan traag.

Wat staat er nu fysiek op de tape?

De tape is een 3,5 mm-brede polyester-nylon strook met Code-128-barcodes die als fysieke file-adressen dienen. In een lus van 9 meter printten de onderzoekers 5.000 ‘tracks’, elk een landingszone voor een DNA-payload. Het format schaalt in theorie naar 5,45×10^5 adresseerbare partities per kilometer, en bij volle vulling komt dat neer op ~362 petabyte per kilometer. In de praktijk werd op basis van het gedemonstreerde fileformaat ~74,7GB per kilometergeëxtrapoleerd (inclusief bekende verliezen).

Adresseren als bij echte tape

De drive gebruikt twee-staps adressering: eerst de juiste barcode, dan de juiste ‘space’ binnen die barcode. Met een camera-lezer haalden de onderzoekers ~1.570 adressen per seconde (10-teken-barcode, tot 2.400 rpm). Dat is puur de locatiebepaling—zonder de tijd voor decapsulatie, extractie en sequencing.

Schrijven/lezen/vervangen op één plek (DMRM)

Opvallend is het deposit-many-recover-many (DMRM)-principe: bestanden worden lokaal gedeponeerd, herhaald uitgelezen, verwijderd en vervangen binnen één partitie.
Deposition gebeurt door hybridisatie aan ‘handles’ op de tape en polymerase-extensie.Verwijderen gaat via een restrictiesite (MboI; 5′-GATC) die de payload losknipt terwijl de handle op de tape blijft.
In 10 herhaalde lees-/schrijfbewerkingen bleef de output stabiel; bij vervangen werd ~99,9% van de oude data succesvol door de nieuwe data verdrongen.

Duurzaamheid via ZIF-bescherming

Elke DNA-payload wordt ingekapseld in een ZIF-laag (zeolitic imidazolate framework) die beschermt tegen water, UV en oxidatie.
Decapsuleren kan snel (~15 s) met een milde buffer; opnieuw inkapselen duurt ~10 minuten. Versnelde veroudering suggereert een halveringstijd die neerkomt op >345 jaar bij kamertemperatuur (20°C) en ~20.000 jaar in koude opslag (bijv. Changbai-gebergte).

De ‘lunchbox-drive’

De onderzoekers bouwden een compacte drive (ter grootte van een lunchbox) met motoren, barcode-lezer, microcontroller en een micro-reactiekamer (‘head’). De drive voert automatisch uit: adresseren, decapsuleren, uitlezen, template herstellen, inkapselen, en desgewenst verwijderen + herdeponeren. In een demo werden drie kleine beeldbestanden teruggelezen en één partitie ‘gerepareerd’ door het juiste bestand opnieuw te deponeren—totale cyclus ~150 minuten.

Proof-of-concept: traag maar functioneel

Gezien het feit dat dit echt nog wel een eerste concept is, is de performance nog zeer traag

  • Lezen: 156,6KB in ~25 min
  • Herschrijven: ~50 min
  • Zoeken/adresseren: theoretisch 1.570 adressen/s (excl. bio-stappen)

Schema van DNA cassette tape en DNA cassette tape drive (bron Science.org)

Fysieke partities en file-addressing op DNA tape (Bron: Science.org)

Waarom dit interessant is

De opslagdichtheid en duurzaamheid zijn indrukwekkend, en de tape-vorm biedt compacte, modulaire integratie(meer ‘heads’, snellere lezers, aangepaste pipet-hardware). Ook is de file-beheerlogica (adressering met barcodes, lokale vervangen/opschonen) veel praktischer dan veel eerdere DNA-prototypes. De achilleshiel blijft de bandbreedte van DNA-synthese en -sequencing: zolang die traag en duur zijn, is dit primair archieftechnologie.

Wat betekent dit in mensentaal?

De onderzoekers hebben in feite een echte tapecartridge gebouwd, maar in plaats van magnetisch materiaal gebruiken ze DNA om data vast te leggen. De drive kan net als een klassieke LTO-tapedrive naar een specifiek “bestand” seeken via barcodes, waardoor bestanden gericht benaderd kunnen worden.

Het bijzondere is vooral de theoretische capaciteit en levensduur. In principe past er honderden petabytes op een kilometer tape, en de data blijft eeuwenlang stabiel dankzij een beschermende ZIF-laag. Dat maakt dit medium ideaal voor archieven of datasets die je letterlijk voor de eeuwigheid wilt bewaren.

Daar staat tegenover dat het systeem vandaag nog extreem traag en duur is. Het prototype kon een bestand van 156 KB pas na 25 minuten uitlezen, en opnieuw schrijven kostte bijna een uur. Dat maakt het volkomen ongeschikt voor dagelijks gebruik, maar prima voor opslag die je slechts zelden hoeft te raadplegen.

De meest waarschijnlijke toepassing ligt dan ook bij archieven, bibliotheken, wetenschappelijke instituten of back-ups die nauwelijks veranderen. Voor massatoepassing is veel goedkopere en snellere DNA-synthese en -sequencingnodig, plus verdere automatisering van de hardware. Tot die tijd blijft DNA-tape vooral een fascinerend onderzoeksproject dat een glimp geeft van de mogelijke toekomst van dataopslag.