Große Sprachmodelle im Bereich der Stoffwechsel‑ und Adipositaschirurgie – Überblick aus aktueller Literatur

USA: Große Sprachmodelle im Bereich der Stoffwechsel‑ und Adipositaschirurgie – Überblick aus aktueller Literatur

Eine aktuelle Scoping‑Review hat 21 englischsprachige Studien analysiert, die den Einsatz großer Sprachmodelle (LLMs) in der Stoffwechsel‑ und Adipositaschirurgie untersuchen. Die Analyse zeigt, dass LLMs vor allem bei der Patientenaufklärung und der Bereitstellung von Informationen gute Leistungen erbringen, während ihre Zuverlässigkeit bei komplexen klinischen Entscheidungen, etwa individuellen Operationsempfehlungen, deutlich geringer ist.

Methodik und Datenbasis

Die Untersuchung folgte dem methodischen Rahmen des Joanna Briggs Institute und den PRISMA‑ScR‑Richtlinien. Sie umfasste systematische Suchabfragen in PubMed, Web of Science, The Cochrane Library, Embase, CINAHL, CNKI, Wanfang und VIP von den jeweiligen Datenbankgründungen bis November 2025. Alle gefundenen Publikationen wurden nach festgelegten Einschlusskriterien gesichtet und inhaltlich zusammengefasst.

Anwendungsbereiche der LLMs

Die ausgewerteten Studien identifizierten drei Hauptanwendungsfelder: (1) Patientenaufklärung und Informationsberatung, (2) klinische Entscheidungsunterstützung und (3) fachliche Wissensabfrage für Ärzt*innen. In den meisten Fällen wurden generische Modelle wie GPT‑4 eingesetzt, während einige Arbeiten spezialisierte, domänenbezogene Modelle testeten.

Leistungsbewertung der Modelle

Die Ergebnisse belegen, dass GPT‑4 im Vergleich zu anderen Modellen häufig höhere Genauigkeitswerte erreichte, insbesondere bei reinen Informations‑ und Aufklärungsaufgaben. Domänenspezifische Modelle zeigten jedoch Potenzial, wenn sie gezielt für chirurgische Fachbegriffe trainiert wurden. Bei komplexen, individualisierten Operationsentscheidungen wichen die Antworten der Modelle jedoch häufig von den Einschätzungen erfahrener Chirurgen ab.

Herausforderungen und Grenzen

Die Review weist mehrere kritische Punkte auf: Die Genauigkeit der bereitgestellten Informationen variiert stark, die Lesbarkeit ist nicht immer an das Niveau von Patienten angepasst, und die klinische Anwendbarkeit bleibt begrenzt. Darüber hinaus besteht ein Risiko von Fehlinterpretationen, wenn die Modelle ohne menschliche Kontrolle eingesetzt werden.

Schlussfolgerungen und Ausblick

Die Analyse kommt zu dem Ergebnis, dass große Sprachmodelle ein unterstützendes Potenzial für die Wissensvermittlung und Patientenaufklärung in der Stoffwechsel‑ und Adipositaschirurgie besitzen. Für den Einsatz bei komplexen klinischen Entscheidungen sind jedoch weitergehende Qualitätsstudien, die Entwicklung spezialisierter Modelle und standardisierte Evaluationsverfahren erforderlich. Zukünftige Forschung sollte zudem sichere und effektive Modelle der Mensch‑KI‑Zusammenarbeit erarbeiten.

Dieser Bericht basiert auf Informationen von PLOS ONE, lizenziert unter Creative Commons BY 4.0 (Open Access). Wissenschaftliche Inhalte, offen zugänglich.

Ende der Übertragung

Originalquelle