Antikörper‑Sprachmodelle profitieren von biologisch informierten Trainingsmethoden

Forscher um Frederick Matsen vom Fred Hutchinson Cancer Center haben eine neue Trainingsstrategie für Antikörper‑Sprachmodelle vorgestellt, die die charakteristischen Mutationsmuster der somatischen Hypermutation nutzt und damit sowohl die Vorhersagegenauigkeit als auch die Effizienz der Modelle steigert.

Biologischer Kontext der Antikörper

Das Immunsystem erzeugt Antikörper, die durch somatische Hypermutation und klonale Selektion eine enorme Diversität erreichen. Während die Hypermutation zufällige Änderungen im Bindungsbereich des Antikörpers erzeugt, fördert die klonale Selektion Varianten mit höherer Antigenaffinität – ein Prozess, der als Affinitätsreifung bezeichnet wird.

Beschränkungen bestehender Modelle

Bestehende Protein‑Sprachmodelle basieren überwiegend auf masked language modelling (MLM), bei dem ein einzelnes Aminosäure‑Residuum maskiert und vom Modell vorhergesagt wird. Studien haben gezeigt, dass MLM‑Modelle bei Antikörpern vor allem die durch Hypermutation eingeführten Sequenzbiases erlernen, ohne die funktionale Selektion zu berücksichtigen.

Phylogenetisches Paar‑Modelling

Die neu entwickelte Methode verwendet phylogenetisches Paar‑Modelling, bei dem jeweils ein Eltern‑ und ein Kind‑Sequenzpaar aus der Evolutionsgeschichte eines Antikörpers als Trainingsdaten dient. Ein Deep Amino Acid Selection Model (DASM) wird trainiert, indem bekannte Mutationswahrscheinlichkeiten aus bestehenden Hypermutationsmodellen einbezogen werden, sodass das Modell ausschließlich die Selektionsdruck‑Komponente erlernt.

Leistungssteigerung

Ergebnisse zeigen, dass DASM bestehende, deutlich größere Modelle in Vorhersagegenauigkeit und Geschwindigkeit übertrifft, ohne zusätzlichen Rechenaufwand zu erfordern. Die Reduktion der Modellgröße erleichtert zudem die Anwendung in ressourcenbeschränkten Umgebungen.

Implikationen für die Therapieentwicklung

Die verbesserte Modellleistung kann die Entwicklung von Antikörper‑Therapeutika beschleunigen, indem sie präzisere Vorhersagen über Bindungsaffinitäten liefert. Darüber hinaus liefert die Methode Einblicke in die Mechanismen der Affinitätsreifung und könnte auch für das Training von T‑Zell‑Rezeptor‑Modellen von Nutzen sein.

Publikationsdetails

Der Artikel „Antibody Language Models: Taking the biology seriously makes models better“ erschien 2026 in eLife (Band 15:e111070). Die Autoren Antonio Matas‑Gil und Andreas Tiffeau‑Mayer gehören zur Division of Infection and Immunity sowie zum Institute for the Physics of Living Systems der University College London, Vereinigtes Königreich.

Dieser Bericht basiert auf Informationen von eLife, lizenziert unter Creative Commons BY 4.0 (Open Access). Wissenschaftliche Inhalte, offen zugänglich.

Ende der Übertragung

Originalquelle