DIASyM – Data-Independent Acquisition-based Systems Medicine

Im Rahmen des Verbundprojekts DIASyM soll ein lokaler Forschungskern für Massenspektrometrie in der Systemmedizin in Mainz aufgebaut werden. Sein Schwerpunkt wird auf Herz-Kreislauf-Erkrankungen liegen, genauer gesagt auf der Erforschung des Herzinsuffizienz-Syndroms. Obwohl allein in Europa 15 Millionen Menschen an einer Herzinsuffizienz leiden und die Erkrankung die häufigste Ursache für Krankenhausaufenthalte von Personen über 65 Jahren ist, sind die zugrundeliegenden molekularen Mechanismen der Krankheit weitgehend unbekannt.

Die im DIASyM-Verbund vereinten Expertinnen und Experten aus den Bereichen Kardiologie, Massenspektrometrie und Bioinformatik verfolgen nun mit einem systemmedizinischen Forschungsansatz das Ziel, das Herzinsuffizienz-Syndrom zu entschlüsseln. Aufbauend auf einer umfangreichen Phänotyp-Datensammlung von Herzinsuffizienz-Patientinnen und -Patienten sollen massenspektrometrische Workflows entwickelt, optimiert und standardisiert werden. Ziel ist es, mithilfe von überwiegend datenunabhängigen massenspektrometrischen Messmethoden eine detaillierte Charakterisierung von erkrankten Personen auf Protein-, Fett- und Stoffwechselprodukt-Ebene im Hochdurchsatz zu ermöglichen. Die standardisierten Prozesse und Arbeitsabläufe sollen dabei insbesondere die Reproduzierbarkeit der Probenvorbereitung, die massenspektrometrische Datenerfassung im Hochdurchsatz sowie die mehrdimensionale Datenanalyse entscheidend verbessern.

Durch das Einbeziehen all dieser Datensätze (klinische Phänotypen, Multi-Omics-Daten sowie massenspektrometrische Analysekarten) wird ein systemmedizinischer Ansatz verfolgt, der zu neuen Erkenntnissen bei der Herzinsuffizienz führt.


Das Teilprojekt Machine Learning soll die bereits vorprozessierten Daten mit
Hilfe von modernen Machine-Learning-Verfahren analysieren. Zudem sollen hier Bias
berücksichtigt bzw. reduziert werden sowie verständliche und prinzipiell interpretierbare
Resultate generiert werden. Das Teilprojekt konzentriert sich auf die differenzielle Analyse der Multi-OMICs Daten über die Zeit in Bezug auf eine spezifizierte Zielvariable (z. B. ein Ereignis wie HF). Der Ansatz basiert auf dem Multi-View-Lernen, bei dem die Proteomik, Metabolomik und Lipidomik jeweils eine Sicht (View) auf die Daten darstellt. Weitere Sichten sind u. a. demographische Variable und Daten aus den Krankenakten. Im Rahmen der Arbeitsschritte soll ein flexibler Umgang mit den Sichten und der zeitlichen Information realisiert werden, ohne zu viele vorab getroffene Annahmen über die Tiefe der Integration und die Relevanz von bestimmten Zeitpunkten oder Zeitintervallen.

Link: BMBF-Homepage