AI für das Design von Oligonukleotid-Therapeutika

Insbesondere für Antisense-Oligonukleotide (ASO), die durch RNAse H1-mediated Knockdown wirken, sind Bindungsenergien und Kinetik von ASO-mRNA-Duplexen entscheidend für die Vorhersage von Wirksamkeit und Sicherheit. Wir sagen Bindungsenergien anhand von Sequenzen voraus, untersuchen die Kinetik der ASO-Reaktionen, um den Entwurfsprozess von ASO-Medikamenten vorhersehbarer zu machen, und kombinieren in Kooperationsprojekten Molekulardynamik und künstliche Intelligenz, um Vorhersagemodelle für eine breitere Palette von Nukleotidmodifikationen zu erweitern. Unsere federated, privacy preserving Lernmethoden ermöglichen auch ohne Austausch von Daten ML-Modelle für die Vorhersage von Bindungsenergien zu lernen.

ML für pan-genomische Graphen

Pan-Genom-Graphen bieten einen prinzipiellen Ansatz für den Umgang mit strukturellen Variationen und, allgemein, dem hohen Grad an Variationen zwischen individuellen Genomen. ML auf Pan-Genom-Graphen wird es ermöglichen, Vorhersage- und Regressionsaufgaben für verschiedene Populationen zu bewältigen, einschließlich Größen, die für Oligonukleotid-Therapeutika relevant sind, wie Transkriptionsgeschwindigkeit oder DNA-Accessibility, sowie klinisch relevante Variablen.

ML und Algorithmik für Sequenzierdaten

Die von experimentellen Hochdurchsatzplattformen wie dem High-Throughput Sequencing (HTS) erzeugten Daten stellen eine rechnerische Herausforderung dar, insbesondere wenn fortschrittliche statistische Ansätze wie Bayes'sche Methoden zur Analyse verwendet werden. In der Vergangenheit haben wir einen komprimierenden Genomik-Ansatz entwickelt, der vom Big Data to Knowledge Program (BD2K) der NIH finanziert wurde, Wavelet-Kompression in Bayes'schen HMMs zur Erkennung von Kopienzahlvarianten eingesetzt und den Nutzen statistischer ML-Modelle, die Genome repräsentieren - Markov-Ketten variabler Länge - durch schnellere Lernalgorithmen erheblich verbessert. Dies ermöglicht z. B. alignementfreie Genomvergleiche aus Rohdaten.

Lehre

Computational Thinking ist heute eine Grundvoraussetzung für fast alle Disziplinen. Die Vermittlung von algorithmischen Ideen kann von Software-Tools stark profitieren. Wir entwickeln Animationssysteme für Graphenalgorithmen, die auf dem Desktop, als Web-App und bald auch als iOS-App verfügbar sind; CATBox ist ein Springer-Lehrbuch, das Gato verwendet. Mit unserer Hidden Markov Model-Bibliothek können sich die Lernenden auf die Lösung spannender bioinformatischer Probleme konzentrieren.