(socialON) Analyse gesammelter Daten. Patientenakten auswerten, ohne die Privatsphäre zu verletzen. Patientenakten könnten wichtige Hinweise enthalten, wie man Krankheiten früher erkennen kann. Doch bei ihrer Analyse werden leicht persönliche Daten preisgegeben. Hier hilft die Mathematik.
Gesammelte Patientenakten auszuwerten und dabei keine sensiblen Informationen über einzelne Personen preiszugeben ist eine Herausforderung. Das Team um Prof. Dr. Hans Simon vom Horst-Görtz-Institut für IT-Sicherheit der Ruhr-Universität Bochum hat eine Methode entwickelt, die das erlaubt. Die Mathematiker verrauschen die Daten so, dass einzelne Personen bei der Analyse anonym bleiben. Trotzdem können selbstständig lernende Computerprogramme in den veränderten Daten ähnlich gut Zusammenhänge aufdecken wie in den Originaldaten.
Verrauschte Daten
Im Prinzip funktioniert das Verrauschen wie folgt: Für jede Patientenakte wird gewürfelt; die Zahl der Augen wird auf alle Werte in der Akte aufaddiert. Das verändert die einzelnen Daten unvorhersehbar und heftig, macht sich aber im Idealfall bei statistischen Zusammenfassungen nicht stärker bemerkbar als eine ohnehin in den Daten enthaltene Zufallsschwankung.
Für ihre Arbeit haben die Wissenschaftler am Bochumer Lehrstuhl für Mathematik und Informatik zunächst genau definiert, was es mathematisch bedeutet, dass die Patienten anonym bleiben sollen. Und was es heißt, dass die Ergebnisse mit und ohne Verrauschen ähnlich sein sollen. Um die definierten Anforderungen zu erfüllen, übersetzten die Mathematiker das Problem in eine geometrische Darstellung.
Daten als Vektoren dargestellt
Jede Patientenakte repräsentierten sie als Vektor, also als einen Pfeil in einem geometrischen Raum. Der Auswertalgorithmus durfte nur Ja/Nein-Fragen stellen, etwa: Ist der Patient Raucher? Ist der Patient schwerer als 80 Kilogramm? Auch jede dieser Fragen stellten die Mathematiker als Vektor dar. Bildeten die Vektoren für Akte und Frage einen stumpfen Winkel, symbolisierte das eine Nein-Antwort; ein spitzer Winkel stand für eine Ja-Antwort.
Die Wissenschaftler verrauschten dann nicht mehr die Originaldaten, sondern führten diesen Schritt erst aus, nachdem sie die Daten in Vektoren umgewandelt hatten. Das erlaubte es ihnen, Informationen über einzelne Patienten anonym zu halten, aber trotzdem statistische Aussagen über die gesammelten Daten aller Patienten zu treffen.
Ausführlicher Beitrag im Wissenschaftsmagazin Rubin
Das Wissenschaftsmagazin Rubin der Ruhr-Universität Bochum berichtet ausführlich über die Arbeit von Hans Simon unter http://rubin.rub.de/de/wie-mathematik-patienten-schuetzt. Texte auf der Webseite und Bilder aus dem Downloadbereich dürfen unter Angabe des Copyrights für redaktionelle Zwecke frei verwendet werden.
Weitere Informationen
Prof. Dr. Hans Simon, Lehrstuhl Mathematik und Informatik, Horst-Görtz-Institut für IT-Sicherheit, Ruhr-Universität Bochum, Tel.: 0234 32 22797, E-Mail: hans.simon@rub.de
Dr. Julia Weiler
Ruhr-Universität Bochum (RUB)
Dezernat Hochschulkommunikation
Wissenschaftskommunikation
Tel: +49 (0)234/32-25228
Gebäude: UV 0/40
Universitätsstr. 150, 44801 Bochum
julia.weiler@uv.rub.de
www.uv.rub.de/dezernat8
Quelle: Pressemitteilung Ruhr-Universität Bochum vom 09.05.2016.