Medizin im Datenrausch
Genomik, digitalisierte Patientendossiers und Echtzeit-Gesundheitsüberwachung – noch nie waren so viele Gesundheitsdaten verfügbar. Drei ETH-Forscher erz?hlen, wie sie aus der Datenflut relevante Informationen gewinnen und welche Chancen dies für die personalisierte Medizin birgt.
Karsten Borgwardt spricht unaufgeregt und bedacht, als wollte er dadurch etwas Ruhe in ein Forschungsgebiet bringen, in dem es turbulent zu und her geht. Die Datenwissenschaften in der biomedizinischen Forschung erleben aktuell einen Boom: mehr Professoren, mehr F?rdergelder, mehr Rechenkapazit?t und mehr Forschungskooperationen. Borgwardts ?Machine Learning & Computational Biology Lab? am Departement für Biosysteme in Basel ist seit der Gründung im Juni 2014 auf 15 Mitarbeiter angewachsen – und es werden weitere hinzukommen.
Der 36-j?hrige Professor verk?rpert einen neuen Typus von Data Scientist, wie er in der Medizin der Zukunft einen festen Platz einnehmen dürfte. Er hat Informatik mit Biologie im Nebenfach studiert, wobei er in letzterem in seinem vierten Studienjahr zus?tzlich einen Master an der Oxford University absolvierte. Borgwardt ist mit der Entschlüsselung des ersten menschlichen Genoms aufgewachsen und war schon w?hrend des Studiums fasziniert von den neuen M?glichkeiten in der Genomik. Doch heute weiss er, dass die anf?nglichen Hoffnungen oft überzogen waren: ?Wir sind nach wie vor weit davon entfernt, vom Genom einer Person pr?zise auf das Vorkommen komplexer Krankheiten schliessen zu k?nnen.? Eine m?gliche Erkl?rung dafür: Nicht einzelne Ver?nderungen im Genom, sondern vielmehr die Interaktion von Millionen von Basenpaaren in der menschlichen DNA sind für komplexe Krankheiten wie Krebs oder Diabetes verantwortlich. Und hier kommt die Informatik ins Spiel.
Datenexplosion in der Genomik
Um solche Interaktionen abbilden und simulieren zu k?nnen, braucht es Unmengen von Daten. Heute – 16 Jahre nach der Ver?ffentlichung der Sequenz des menschlichen Genoms – sind diese verfügbar. ?Wir erleben aktuell eine Explosion der Datenmengen in mehreren Dimensionen? erz?hlt Borgwardt. Durch technische Fortschritte in der Genomik k?nnen heute Milliarden Basenpaare eines menschlichen Genoms in wenigen Tagen sequenziert werden – und das für weniger als 2000 Franken. Das er?ffnet komplett neue M?glichkeiten: Standen früher Fragen auf der Molekularebene des Individuums im Vordergrund, so besch?ftigen sich Forschende heute immer mehr mit Fragen auf Populationsebene; letztendlich also mit dem Erbgut der gesamten Menschheit. Zugleich verschiebt sich die ?berwachung des Gesundheitszustands von punktuellen Messungen, zum Beispiel beim j?hrlichen Arztbesuch, zu kontinuierlichen Echtzeitmessungen. Mit ?Wearables? und Smartphone-Apps k?nnen schon heute jederzeit Puls, K?rpertemperatur und Bewegungsmuster aufgezeichnet werden. Zu den neuen M?glichkeiten in Gesundheitsüberwachung und Genomik kommt hinzu, dass Patientendossiers in den Spit?lern zunehmend elektronisch verfügbar sind.
In all diesen Daten steckt grosses Potenzial. Gelingt es, sie gezielt zu nutzen, so k?nnten Therapien personalisiert und deren Wirkung erh?ht werden, so die Hoffnung der Forscher. ?Dabei wird der Zufall zu einer extrem wichtigen Gr?sse?, erkl?rt Borgwardt. Denn ein Algorithmus muss unterscheiden k?nnen zwischen zuf?lligen Zusammenh?ngen zwischen Patientendaten und dem Auftreten einer Krankheit und statistisch-signifikanten. ?Aufgrund der Gr?sse der multidimensionalen Datenr?ume stellen sich klassische Fragen der Statistik komplett neu.? Mit Hilfe eines SNF-Starting Grants entwickelt seine Forschungsgruppe deshalb neue Algorithmen, die statistisch-signifikante Muster in riesigen Datenbergen entdecken. Die Algorithmen sind schneller, ben?tigen weniger Rechenkapazit?t und k?nnen relevante von irrelevanten Daten viel effizienter als bisher trennen.
Für die Intensivstation
Durch die Fortschritte in der Genomik und die zunehmende Digitalisierung von Patientendaten wird Data Science für die Medizin relevant. Das ?European Bioinformatics Institute? prognostiziert, dass bis in fünf Jahren das Genom von 15 Prozent der Bev?lkerung in Industriel?ndern, also 150 Millionen Menschen, sequenziert sein wird. Gunnar R?tsch, Professor für Biomedizininformatik, rechnet vor: Das w?ren rund 28 Exabyte (= 28×109 Gigabyte) an Daten. Um aus solchen Datenmengen für Forschung und Patienten Wissen zu gewinnen, das zu pr?ziseren und personalisierten Therapien beitr?gt, sind neue, effiziente Algorithmen n?tig. Diese sollen zum Beispiel in Milliarden von Basenpaaren nach krankheitsrelevanten Interaktionen suchen. R?tschs Gruppe arbeitet im Rahmen eines Projekts im Nationalen Forschungsprogramm 75 ?Big Data? daran, die grossen Genomdatenmengen effizient zu speichern und zu analysieren. ?Wir befinden uns mitten in einem Durchbruch!?, sagt der Datenwissenschaftler euphorisch.
Doch wie k?nnen Patienten konkret von solchen smarten Algorithmen profitieren? R?tsch pr?sentiert ein praktisches Beispiel: In enger Zusammenarbeit mit dem Inselspital Bern entwickelt seine Gruppe zusammen mit der Gruppe von Borgwardt ein Frühwarnsystem für Organversagen auf der Intensivstation. W?hrend zehn Jahren hat das Spital von nahezu 54 000 Patienten Daten zu Blutdruck, Puls, Temperatur, Medikamenteinnahme, Glukose- und Laktosestand sowie Elektrokardiogramm (EKG) aufgezeichnet. R?tsch entwickelt nun Algorithmen, um diese 500 Gigabyte an Daten mit rund 3,5 Milliarden Einzelmessungen auf Muster hin zu analysieren, die auf einen baldigen Notfall hindeuten. ?rzte und Pfleger k?nnten dadurch künftig Massnahmen einleiten, bevor sich der Gesundheitszustand eines Patienten sichtbar verschlechtert. Für solche Systeme ist maschinelles Lernen n?tig, ein wichtiges Teilgebiet der Data Science. Programme sollen aus einem gegebenen Datensatz Muster und Gesetzm?ssigkeiten erkennen und dadurch kontinuierlich hinzulernen.
Automatisierte Radiologie
Nicht nur bei der Auswertung von Patientendaten, sondern auch bei der Weiterentwicklung von medizinischen Ger?ten spielt maschinelles Lernen eine wichtige Rolle. So zum Beispiel bei der Magnetresonanztomographie (MRI), die heute, besonders bei Weichteilen, zu den wichtigsten medizinischen Untersuchungsmethoden geh?rt. Klaas Prüssmann, Professor am Institut für Biomedizinische Technik, das von der ETH und Universit?t Zürich gemeinsam betrieben wird, hat sich der Weiterentwicklung der MRI verschrieben. In einem kürzlich publizierten Artikel beschreibt er ein System, das mit 30 Temperatur- und 16 Magnetsensoren eine Selbstdiagnose des MRI-Ger?ts erstellt. Bei verd?chtigen Mustern k?nnten Techniker künftig frühzeitig gewarnt und so Ausfallzeiten des Ger?ts im Spital verkürzt und Kosten gespart werden.
Auch Prüssmann spürt in seinem Forschungsbereich aktuell ?den Vorabend einer Goldgr?berzeit?. Er geht davon aus, dass Data Science in Zukunft nicht nur MRI-Ger?te, sondern auch die Bildgebung an sich ver?ndern wird. ?Wenn es uns gelingt, bei MRI-Aufzeichnungen relevantes Vorabwissen, zum Beispiel, dass wir ein Hirn und nicht ein Herz untersuchen, in eine für unser System verwertbare Form zu bringen, k?nnten wir die Geschwindigkeit, Effizienz und Aussagekraft der Messungen stark steigern.? Zugleich prognostiziert Prüssmann auch für die Radiologie gr?ssere Umbrüche. In Zukunft wird es n?mlich m?glich, Millionen von bestehenden MRI-Bildern mit einer aktuellen Messung zu vergleichen. Daraus k?nnen wichtige Hinweise auf bestimmte Krankheiten gewonnen werden. Zudem k?nnen Algorithmen Muster in MRI-Bildern erkennen, die von blossem Auge nicht sichtbar sind.
Ruf nach Harmonisierung
Eine der gr?ssten Herausforderungen für Data-Science- Anwendungen im Gesundheitswesen, da sind sich die Experten einig, ist die fehlende Harmonisierung der Daten. ?Anonymisierte Daten aus unterschiedlichen Spit?lern zu Forschungszwecken sind oft nicht direkt vergleichbar ?, erz?hlt Borgwardt. Und sein Kollege R?tsch erg?nzt: ?In Spit?lern wurden Daten bislang oft für Krankenkassenabrechnungen gesammelt und nicht für die weitere Analyse.? Er setzt grosse Hoffnungen in das ?Swiss Personalized Health Network? (SPHN), an dem sich Schweizer Hochschulen und Kliniken beteiligen, um die Interoperabilit?t der Daten zu sichern und den Datentransfer zwischen Spit?lern und Forschungsinstitutionen zu erleichtern.
R?tsch sieht weitere Herausforderungen: ?Im klinischen Alltag stehen die Patienten und die Datensicherheit an vorderster Stelle und nicht das Aufzeichnen aller relevanten Daten für weiterführende Big-Data-Forschung.? Datenwissenschaftler müssten noch klarer aufzeigen, wo sie Mediziner unterstützen k?nnen, ohne den klinischen Alltag zu st?ren oder die Datensicherheit zu gef?hrden. Deshalb erachtet er den Bachelor Humanmedizin, der im Herbst 2017 zum ersten Mal an der ETH durchgeführt wird und der auch Kurse in Informatik und maschinellem Lernen beinhaltet, als wichtigen Schritt im Zusammenrücken von Datenwissenschaften und Medizin. ?Der Einzug von Data Science ins Spital wird auch eine neue Generation von Medizinern hervorbringen?, ist R?tsch überzeugt.
Dieser Artikel ist in der aktuellen Ausgabe von ?Globe? erschienen.