Chronos Briefing
LIVE SYSTEM
--:--:--
Zurueck
LLMs erreichen bis 2025 fast 80 % Genauigkeit im chinesischen Pflegeexamen
AI GENERATED 02.07.2026 21:15 Wissenschaft und Forschung

LLMs erreichen bis 2025 fast 80 % Genauigkeit im chinesischen Pflegeexamen

In den Jahren 2022 bis 2025 wurden fĂĽnfzehn fĂĽhrende groĂźe Sprachmodelle (LLMs) anhand der chinesischen Nationalen PflegezulassungsprĂĽfung (NNLE) getestet. Die Analyse zeigte, dass die besten Modelle die Genauigkeit…

In den Jahren 2022 bis 2025 wurden fünfzehn führende große Sprachmodelle (LLMs) anhand der chinesischen Nationalen Pflegezulassungsprüfung (NNLE) getestet. Die Analyse zeigte, dass die besten Modelle die Genauigkeit von 47,0 % im Jahr 2022 auf 78,8 % im Jahr 2025 steigerten und damit die angenäherte Bestehensgrenze von 300 Punkten fast erreichten.

Methodik

Die Untersuchung beruhte auf einem Korpus von 9.800 Multiple-Choice‑Fragen, die aus den offiziellen NNLE‑Jahrungen 2022‑2025 extrahiert wurden. Die Modelle wurden im Zero‑Shot‑Modus mit einheitlichen Prompt‑Schemata abgefragt, wobei jedes Modell nur Prüfungen bearbeitete, die nach seiner Veröffentlichung stattfanden.

Ergebnisse nach Modelltyp

Ein zentrales Ergebnis ist die konstante Überlegenheit chinesisch‑sprachiger Modelle gegenüber internationalen Pendants. Der durchschnittliche Vorsprung betrug 6,1 Prozentpunkte im Jahr 2023 und verringerte sich bis 2025 auf 3,0 Prozentpunkte.

Der relative Vorteil des jeweils besten Modells gegenĂĽber dem zweitbesten schwankte. Im Jahr 2023 lag er bei 4,5 Prozentpunkten, 2024 bei 3,0 Prozentpunkten und 2025 bei 3,8 Prozentpunkten, was auf nicht monotone Fortschritte hindeutet.

Abschnittsbezogene Leistung

Die Leistungsanalyse differenzierte zwischen dem fachlichen Abschnitt „Professional Practice“ und dem anwendungsorientierten Abschnitt „Practical Skills“. In der Wissensdomäne erreichten die Modelle durchschnittlich 81,6 % richtige Antworten, während im praktischen Teil die Genauigkeit bei 70,9 % lag.

Fehleranalyse

Trotz der hohen Punktzahlen wiesen die Top‑Modelle bei 43 % der Fehler Schwächen im klinischen Denkvermögen auf, insbesondere bei der Priorisierung von Pflegeinterventionen. Diese Fehlerkategorie dominierte die Fehlermuster.

Implikationen

Die Autoren betonen, dass die erreichten Ergebnisse nicht als Nachweis für klinische Einsatzfähigkeit oder autonome Praxis interpretiert werden dürfen. Die Prüfungsleistung spiegelt primär codiertes Fachwissen wider, nicht jedoch die komplexe klinische Urteilsbildung.

Die Studie liefert damit eine wichtige Referenz für zukünftige Entwicklungen von LLMs im Gesundheitsbereich und unterstreicht die Notwendigkeit, diagnostische und interaktive Fähigkeiten über reine Wissensabfrage hinaus zu stärken.

Dieser Bericht basiert auf Informationen von PLOS ONE, lizenziert unter Creative Commons BY 4.0 (Open Access).

Ende der Uebertragung

Quellenverzeichnis & Rechtliches

Die Berichterstattung von VisionGaia News basiert auf oeffentlich zugaenglichen Informationen.

Bezugsquellen

  • Open Sources

Lizenzen

  • CC / Public Records

Lizenzprotokolle

Creative Commons BY-SA 4.0

Redaktionelle Eigeninhalte von VisionGaia News stehen unter der
Creative Commons Attribution-ShareAlike 4.0 International.

Datenherkunft: Frei zugängliche, rechtlich zulässige Quellen.
Verarbeitung: KI-gestĂĽtzte Synthese mit redaktioneller PrĂĽfung.


Quellenverzeichnis & Rechtliches

Die Berichterstattung von VisionGaia News basiert auf öffentlich zugänglichen Informationen aus staatlichen, institutionellen und offen lizenzierten Quellen.

Bezugsquellen

  • Deutsche Bundesbehörden
  • EU Institutionen
  • UK & US Government
  • Russian Government
  • UN, WHO, Weltbank
  • Open-Content (Wikinews)
  • Open-Content Networks
  • Wissenschaftliche Fachportale

Lizenzen

  • § 5 UrhG (Amtliche Werke)
  • CC BY 4.0 / CC BY-SA 4.0
  • Creative Commons BY (Open-Content-Projekte)
  • Creative Commons BY 4.0 (Wissenschaftliche Artikel)
  • Open Parliament Licence v3.0
  • Open Government Licence v3.0
  • Public Domain (US)
  • Staatliche Dokumente etc. ohne Copyright (RU)
  • Creative Commons BY 4.0 (RU)
Establishing Uplink...

Privacy Protocol

Wir verwenden CleanNet Technology für maximale Datensouveränität. Alle Ressourcen werden lokal von unseren gesicherten Servern geladen.

Für externe Media-Inhalte (3rd Party Cookies), aktivieren Sie bitte die entsprechenden Optionen. Weitere Details finden Sie in unserer Datenschutzerklärung.

Core SystemsTechnisch notwendig
External MediaMaps, Video Streams etc.
Analytics (VGT Telemetrie)Anonyme AES-256 Metriken
Datenschutz lesen
Engineered by VisionGaiaTechnology