Das musst du wissen
- Normalerweise werden digitale Daten in grossen Datenzentren gespeichert. Doch dies verbraucht viel Energie.
- Eine energieeffiziente Alternative: Forscher der ETH Zürich haben eine Film-Datei in Form der Erbsubstanz DNA kodiert.
- Diese DNA wurde dann künstlich hergestellt und in Glas-Nanopartikeln eingeschlossen - so bleibt sie Jahrtausende stabil.
Die erste Episode der deutschen Serie Biohackers, die ab Donnerstag, den 20. August von Netflix ausgestrahlt wird, war Gegenstand eines futuristischen Forschungsprojekts, an dem die Firma Twist Biosciences und auch ein Labor der ETH Zürich mitgearbeitet haben. Twist hat die 70 Megabyte an Daten aus dieser Episode in Form von künstlichen DNA-Strängen synthetisiert. Die Zürcher Forscher haben das genetische Material in Glas-Nanopartikeln eingekapselt. Auf diese Weise kann es für Tausende von Jahren geschützt existieren – so lange wie die fossile DNA, die Paläontologen finden.
_____________
Abonniere hier unseren Newsletter! ✉️
_____________
Warum das mehr als nur Marketing ist. Die Einführung einer Serie bei der es um synthetische Biologie geht, mit der Datenspeicherung auf DNA zu kombinieren, ist natürlich ein spassiger Kommunikations-Coup. Die zugrundeliegende Forschung ist jedoch ernst zu nehmen. Sie zeigt das Potenzial der DNA-Speicherung auf. Magnetbänder, auf denen digitale Daten normalerweise langfristig gespeichert werden, haben eine maximale Lebensdauer von 50 Jahren. DNA kann hingegen über Tausende von Jahren gelagert werden. Sie hat ausserdem den Vorteil einer viel höheren Dichte und Energieeffizienz. Allerdings bleibt bis zur Anwendung noch etwas zu tun: Noch ist der Preis zu hoch, insbesondere beim Schreiben und Lesen von Informationen.
Das Projekt. Theoretisch würden 20 Gramm DNA ausreichen, um alle digitalen Daten der Welt zu speichern. Darauf aufbauend forscht das Labor für Automatik der ETH Zürich seit mehreren Jahren an der Speicherung von digitalen Informationen auf DNA, unter anderem in Zusammenarbeit mit Microsoft.
- Ein Teil der Forschung bestand darin Technologien zur Herstellung von Glas-Nanopartikeln zu entwickeln, die diese DNA enthalten und schützen, um sie dauerhaft stabil zu machen. Professor Robert Grass, Projektleiter an der ETH Zürich sagt:
«Wir haben uns von fossiler DNA inspirieren lassen, die manchmal intakt genug ist, um auch nach Hunderttausenden von Jahren noch gelesen werden zu können.»
- Die älteste bisher gefundene und zu 70 Prozent entschlüsselte fossile DNA ist 700 000 Jahre alt. Sie wurde in einer Probe eines Pferdezahns im Permafrost von Thistle Creek, Kanada, gefunden.
- Für das Projekt mit Netflix wurden die Zürcher Forscher zunächst von einer Werbeagentur angesprochen, die für die Streaming-Plattform arbeitet. Robert Grass sagt:
«Wir haben ihnen erklärt, dass es teuer, zeitaufwendig und schwierig sein würde. Aber sie waren damit einverstanden, es durchzuziehen.»
- Zunächst schickte Netflix die 46-minütige digitale, etwa 70 Megabyte grossen Datei der ersten Episode von Biohackers nach Zürich.
- Von dort aus wandelten Professor Grass und sein Team die digitale Information, die binären Sequenzen von 0 und 1, in genetische Information um, das heisst in die chemische Form der vier Nukleotide, aus denen die DNA besteht: Adenin (A), Thymin (T), Cytosin (C) und Guanin (G). In diesem Fall entsprach zum Beispiel die Zahlenfolge 0-0 einem «A», 0-1 einem «C» und so weiter.
- Diese Daten wurden dann an Twist Biosciences in San Francisco geschickt, wo sie auf 4 Millionen kurzen DNA-Abschnitten, jedes 200-300 Basen lang, kodiert wurden. Jeder DNA-Abschnitt speichert nicht nur einen Teil der Originaldatei, sondern enthält zusätzlich einen Index, der seinen Platz in der Gesamtdatei angibt, um eine geordnete Rekonstruktion der Informationen zu ermöglichen.
Twist Biosciences hat eine Silizium-Chip-Technologie entwickelt, die die Synthese von mehr als einer Million Basenpaare auf einem einzigen Chip ermöglicht. Zum Vergleich: Herkömmliche Methoden können nur 96 Basenpaare auf einem Chip kodieren. So hatte die DNA-Druckerei im Rahmen eines Projekts der «ArtTech Foundation» bereits die Videoclips zu «Smoke on the Water» von Deep Purple und «Tutu» von Miles Davis aus den Archiven des Montreux Jazz Festival in DNA-Form festgehalten.
- Im Fall der Netflix-Serie wurden die DNA-Fragmente dann von den Zürcher Forschenden in Glas-Nanopartikeln verkapselt. Robert Grass sagt dazu:
«Da dieses Glas nicht einfach bei hohen Temperaturen geschmolzen werden kann, wachsen die Moleküle durch Polymerisation.»
- Die Informationen werden dann mit einem DNA-Sequenziergerät gelesen, wie es von Biologen üblicherweise zum Ablesen des Genoms verwendet wird.
Die Kosten. Nach wie vor ist der Prozess des Schreibens und Lesens von Informationen teuer und langsam. Robert Grass spricht von etwa 1 000 Dollar pro Megabyte für die DNA-Kodierung im Wissenschaftsbetrieb. Beim Lesen sind die Kosten für die Sequenzierung menschlicher DNA unter 1 000 Dollar gefallen. Aber auf jeden Fall wäre die Speichermethode heutzutage nicht geeignet, vor allem nicht für das Streaming.
Dazu Emily Leproust, CEO von Twist Biosciences:
«Um im Angesicht heutiger Technologien wettbewerbsfähig zu sein, müssen die Kosten für die DNA-Lagerung um einen Faktor von einer Million sinken.»
Sie glaubt, dass dies letztendlich durch eine weitere Miniaturisierung von Twists Plattform möglich sein wird, mit anderen Worten, durch die Synthese von noch mehr DNA-Strängen auf jedem Chip.
Twist hat sich kürzlich einem Projekt der US-Regierung angeschlossen, «Scalable Molecular Archival Software & Hardware» (SMASH). Es zielt darauf ab, die langfristige Speicherung von DNA-Daten innerhalb der nächsten drei bis fünf Jahre zugänglich und kommerziell nutzbar zu machen.
Energiehungrige Rechenzentren. Das phänomenale Wachstum der digitalen Daten stellt die traditionelle Form der Speicherung vor Herausforderungen.
- Nach Angaben der Beratungsfirma «International Data Cooperation» produzierte die Welt im Jahr 2018 ganze 33 Trillionen Gigabyte an Daten. Die Firma prognostiziert eine Produktion von 175 Trillionen Gigabyte im Jahr 2025.
- Es wird geschätzt, dass die Menge der produzierten Daten seit 2010 schneller wächst als die neue Speicherkapazität und sich bis 2025 mehr als verdoppeln wird.
- Ein digitales Datenspeicherzentrum verfügt heute über eine Datenspeicherkapazität von rund einer Milliarde Gigabyte.
- Es muss jedoch gekühlt werden, daher ist sein Energieverbrauch hoch. Dazu Robert Grass:
«Die begrenzte Lebensdauer von Magnetspeichern bedeutet auch, dass Daten regelmässig kopiert werden müssen, um sie zu erhalten. Dies führt zu einer weiteren Form des Stromverbrauchs.»
- Laut einem Artikel in «Nature» aus dem Jahr 2018 verbrauchen Rechenzentren jedes Jahr etwa 200 Terawattstunden. Dies entspricht mehr als dem Dreifachen des jährlichen Stromverbrauchs der Schweiz. Sie tragen etwa 0,3 Prozent zu den rasch wachsenden globalen CO₂-Emissionen bei. Alle Informationstechnologien zusammen sind für 2 Prozent der Emissionen verantwortlich.
- DNA verbraucht praktisch keine Energie. Emily Leproust schätzt, dass alle Daten der Welt in dieser Form gespeichert werden könnten und dies nur eines jährlichen Verbrauchs von 100 Watt bedürfe. Dabei wird jedoch das Schreiben und Lesen dieser DNA-Daten nicht berücksichtigt.
Die Dichte der DNA. Die DNA jeder menschlichen Zelle kodiert etwa 1,6 Gigabyte an Informationen pro Zelle. Wenn man alle Zellen in unserem Körper zusammenzählt, ergibt dies etwa 100 Milliarden Gigabyte, was 100 Rechenzentren entspricht.
Aber ein Gramm DNA reicht auch aus, um das Äquivalent von 1 000 Milliarden Gigabyte zu speichern.
Emily Leproust sagt:
«Die in den Zellen eines menschlichen Körpers enthaltene DNA könnte das Drei-Milliardenfache aller bisher entstandenen Filme speichern.»