6. Dezember 2024
Artikel von Valentin Munteanu, Vladimir Starostin, Alexander Gerlach, Dmitry Lapkin, Alexander Hinderhofer, Frank Schreiber

Von Menschen gesteuerte neuronale Netze für Synchrotron-Experimente

Synchrotronquellen erzeugen intensive Röntgenstrahlung, die heute für viele Forschungsgebiete unverzichtbar ist. Da in solchen Anlagen riesige Datenmengen erzeugt werden, müssen die relevanten Informationen aus diesen Daten extrahiert werden. Das gelingt mit Methoden des maschinellen Lernens, doch den Modellen fehlen wichtige Vorkenntnisse über die Struktur der untersuchten Systeme. Wir haben Forschenden ermöglicht, dieses Wissen in anpassungsfähige neuronale Netze einzuspeisen, und dadurch genauere Ergebnisse erzielt.

Teilchenbeschleuniger wie das CERN sind seit Langem Wegbereiter für Innovationen und haben auch Fortschritte im maschinellen Lernen und der Datenverarbeitung angestoßen. Diese Forschungseinrichtungen müssen riesige Datenmengen verwalten und analysieren, was zur Entwicklung ausgeklügelter Algorithmen und Technologien führt. Heute erleben Synchrotronquellen – spezialisierte Teilchenbeschleuniger, die hochintensive Röntgenstrahlen erzeugen – einen ähnlichen „CERN-Moment“, da die Datenproduktion ein nie dagewesenes Niveau erreicht.

Synchrotronquellen wie die ESRF in Grenoble und PETRA III in Hamburg unterstützen die Forschung in einer Vielzahl wissenschaftlicher Disziplinen, von den Materialwissenschaften über die Biologie und die Umweltwissenschaften bis hin zur Archäologie. Ihre hochintensiven Röntgenstrahlen sind unverzichtbar für die Untersuchung molekularer Strukturen, die Entwicklung von Nanomaterialien, das Verständnis von Proteinstrukturen und komplexen biologischen Systemen sowie für die Freilegung historischer Artefakte.

Luftaufnahme der Europäischen Synchrotronstrahlungsanlage (ESRF) in Grenoble, Frankreich. © ESRF / P.JAYET

Die technischen Innovationen an den Synchrotronquellen haben die Intensität der erzeugten Röntgenstrahlung in den letzten Jahren exponentiell verbessert und damit zahlreiche neue Möglichkeiten für wissenschaftliche Anwendungen eröffnet. Diese Entwicklungen stellen jedoch neue Herausforderungen an die Algorithmen des maschinellen Lernens. Als Folge werden Innovationen im Bereich des maschinellen Lernens angestoßen, um der wachsenden Menge und Komplexität der erzeugten Daten gerecht zu werden. Solche Fortschritte sind unerlässlich, um das Potenzial der Synchrotronforschung und ihren weitreichenden Nutzen auszuschöpfen.

Die Dynamik der angewandten experimentellen Wissenschaft

Eine große Herausforderung für die Forschung an Synchrotronquellen ist es, den unterschiedlichen experimentellen Ansprüchen der Gastwissenschaftlerinnen und Gastwissenschaftler gerecht zu werden. Mit einer spezifischen Streutechnik wie der Röntgen- (oder Neutronen-) Reflektometrie kann eine Vielzahl von Systemen untersucht werden – von Halbleitern und organischen Solarzellen bis hin zu biologischen Membranen. Diese Systeme bestehen oft aus mehreren Schichten mit einer Dicke von wenigen Atomen bis zu einigen Mikrometern. Als experimentelle Methode kann die Reflektometrie gewissermaßen „kodierte“ Informationen über diese Schichtstrukturen in Form spezifischer Interferenzmuster liefern. Diese Muster zu dekodieren, um die tatsächliche Struktur des Systems aufzuklären, ist jedoch ein komplexes inverses Problem. Für eine erfolgreiche Analyse sind oft Vorkenntnisse über die Struktur erforderlich, wie z.B. über die Schichtmaterialien, den Herstellungsprozess oder Kenntnisse aus vorangegangenen Studien. Außerdem kann die herkömmliche Analyse von Reflektometriedaten mehrere Stunden in Anspruch nehmen, um eine einzige Struktur zu dekodieren.

In unserer Gruppe entwickeln wir neuronale Netze, um Strukturen aus Reflektometriedaten in Millisekunden zu entschlüsseln. Vor einigen Jahren haben wir den ersten Ansatz für eine Reflektometrie-Analyse auf der Basis neuronaler Netze veröffentlicht. Unsere Lösung war in der Tat viel schneller als herkömmliche Analysemethoden, konnte aber in Bezug auf die Genauigkeit nicht mithalten. Das zusätzliche Vorwissen über das System war ein Schlüsselelement, das dem neuronalen Netz fehlte, denn es hat jede Probe genau gleich analysiert.

In unserer jüngsten Arbeit konnten wir diese Schwäche unserer Methode überwinden. Jetzt können Forschende das neuronale Netz mit Informationen über die Eigenschaften der Materialien und der Grenzflächen bestimmter Strukturen versorgen, was die Unsicherheit der Analyse erheblich verringert und deren Genauigkeit deutlich verbessert. Durch diese wichtige Ergänzung wird das neuronale Netz von einem schnellen, aber ungenauen Ersatz für den Menschen zu einem nützlichen Werkzeug, das Forschende routinemäßig einsetzen können. Wichtig ist, dass die Einbeziehung von dynamischem Vorwissen es ermöglicht, dasselbe Modell für sehr unterschiedliche experimentelle Szenarien und Anwendungen ohne erneutes Training wiederzuverwenden – eine zentrale Voraussetzung für die wissenschaftliche Anwendung.

Abb. 1: Vorwissen hilft dem neuronalen Netz, das Elektronendichteprofil einer physikalischen Struktur (links) aus den Messdaten (rechts) zu rekonstruieren. © VALENTIN MUNTEANU / VLADIMIR STAROSTIN

Autonome Online-Experimente

Unser Ansatz beschleunigt nicht nur die Analyse, sondern ermöglicht darüber hinaus auch neuartige Experimente, die ohne maschinelles Lernen nicht realisierbar wären.

Ein typisches experimentelles Szenario untersucht einen dynamischen Prozess in Echtzeit, indem regelmäßige Momentaufnahmen des Systems mithilfe der Reflektometrie erstellt werden. In vielen Untersuchungen wäre es wünschenswert, die Versuchsbedingungen, wie z. B. die Temperatur, auf der Grundlage neuer Daten anpassen zu können. Dazu müssten die Reflektometriedaten jedoch in Echtzeit dekodiert werden können.

Hier kommt unser Ansatz ins Spiel: Unser neuronales Netz kann mit einer Reihe von Regeln gespeist werden, die ihm sagen, wie es die experimentellen Bedingungen abhängig vom beobachteten Verhalten des Systems anpassen soll. Darüber hinaus kann das neuronale Netz sein Vorwissen automatisch aktualisieren, indem es auf Daten früherer Messungen zurückgreift, so dass keine manuellen Eingaben mehr erforderlich sind. Dies führt zu einem vollständig autonomen System mit geschlossenem Regelkreis, welches wir bereits erfolgreich an einer Synchrotronanlage eingesetzt haben.

Auf diese Weise eröffnet unser Ansatz neue Möglichkeiten für die Reflektometrie und darauf basierende Anwendungen: Durch den Einsatz eines neuronalen Netzes, das mit relevantem Wissen versorgt wird, können Forschende Reflektometriedaten nahezu in Echtzeit verarbeiten. Damit verschiebt sich der Fokus von der langwierigen Datenanalyse hin zu neuen wissenschaftlichen Fragestellungen und neuen experimentellen Möglichkeiten.

Originalpublikation: V. Munteanu, V. Starostin, A. Greco, L. Pithan, A. Gerlach, A. Hinderhofer, S. Kowarik, and F. Schreiber. Neural network analysis of neutron and X-ray reflectivity data incorporating prior knowledge. J. Appl. Cryst. 57 (2024) 456.

Titelillustration: Franz-Georg Stämmele 

Übersetzung ins Deutsche: Fortuna Communication

Kommentare

Ich habe die Datenschutzerklärung zur Kenntnis genommen.
Neueste Forschung
22. August 2024 Hanqi Zhou, Robert Bamler, Charley M. Wu, Álvaro Tejero-Cantero

Den Wissenserwerb nachvollziehen, um lebenslanges personalisiertes Lernen zu ermöglichen

Online-Lernplattformen sind beliebte Apps, um eigenständig Wissen zu erwerben. Allerdings haben sie auch gravierende Schwächen. Wir stellen hier einen neuen Algorithmus vor, mit dem der Wissenserwerb von Lernenden genauer verfolgt werden kann. Indem die Wissensvermittlung an deren persönliche Lernstile angepasst wird, lässt sich der Lernprozess beflügeln. 
Neueste Forschung
18. April 2024 Rita González-Márquez

20 Millionen Papers gleichzeitig durchforsten und neues Wissen freilegen

In der Biomedizin und den Lebenswissenschaften werden jedes Jahr mehr als eine Million Papers veröffentlicht - eine überwältigende Menge. Um die Orientierung in der Literatur zu erleichtern, haben wir mit Hilfe von maschinellem Lernen eine Karte der gesamten biomedizinischen Forschungslandschaft in Form einer interaktiven Webseite erstellt. Sie macht es möglich, 20 Millionen Veröffentlichungen gleichzeitig zu durchsuchen und Schnittmengen zwischen ihnen zu erkennen.