Global Voices: Nur 2 % der afrikanischen Sprachen werden von KI-Moderationssystemen erkannt
Begrenzte Sprachabdeckung
Eine im Jahr 2025 veröffentlichte Studie mit dem Titel „The State of Large Language Models for African Languages“ hat ergeben, dass von mehr als 2 000 afrikanischen Sprachen lediglich 42 in den untersuchten KI‑Moderationssystemen eine nennenswerte Präsenz aufweisen. Damit bleiben rund 98 % der Sprachen für die automatisierten Inhaltsprüfungen unsichtbar.
Praxisbeispiel aus Kenia
Bereket Tsegay, ein früherer Moderator bei TikTok in Kenia, berichtete, dass er täglich Inhalte in Sprachen wie Luo, Dholuo, Kikuyu oder Dinka prüfen musste, obwohl sein persönlicher Sprachhintergrund Amharisch ist. Ohne klare Erkennung der Sprache verließ er sich häufig auf visuelle Signale, was zu unzureichender Moderation führte.
Plattformstatistiken
Laut den Community‑Guidelines‑Durchsetzungsdaten von TikTok für das erste Quartal 2025, die von Business Daily Africa zitiert wurden, wurden zwischen Januar und März 2025 über 450 000 Videos in Kenia entfernt und mehr als 43 000 Konten gesperrt. Im zweiten Quartal stieg die Zahl der Entfernungen auf 592 000, wobei die Plattform die Hauptursache in automatisierten Systemen sieht.
Auswirkungen auf Nutzer
Die fehlende Sprachunterstützung trifft Ersteller, Journalistinnen und Nutzer, die in ihren Muttersprachen kommunizieren. So berichtet der kenianische Ersteller Pauline Onyango, dass Beiträge in Luo kaum algorithmische Reichweite erzielen. Gleichzeitig bleiben schädliche Inhalte in wenig unterstützten Sprachen häufig unbeobachtet, weil das System sie nicht erkennt.
Regulatorischer Rahmen
Der seit August 2024 geltende EU‑KI‑Act verlangt nicht‑diskriminierende KI‑Systeme und repräsentative Trainingsdaten. Die seit Februar 2024 wirksame Digital Services Act (DSA) verpflichtet Plattformen, Entscheidungen zur Inhaltsmoderation transparent zu machen. Ohne Sprachidentifikation können diese Vorgaben nicht erfüllt werden.
Forschungsinitiativen
Initiativen wie AfricaNLP produzieren mehrsprachige Datensätze und Benchmarks für afrikanische Sprachen, etwa für Hassredeerkennung in Hausa und Igbo. Das kanadische Unternehmen Cohere arbeitet mit HausaNLP zusammen, um afrikanische Datensätze in sein mehrsprachiges Modell Aya zu integrieren.
Politische Strategien
Die Afrikanische Union hat im Juli 2024 eine kontinentale KI‑Strategie verabschiedet, die Daten‑Souveränität und sprachliche Vielfalt betont. Nationale Strategien, etwa Nigerias KI‑Plan von April 2025, greifen diese Vorgaben auf, ohne jedoch konkrete Umsetzungsmaßnahmen zu definieren.
Wirtschaftliche HintergrĂĽnde
Der Mangel an digitalen Textressourcen für die meisten afrikanischen Sprachen erklärt die geringe Abdeckung. Englisch, Französisch, Chinesisch und Arabisch erhalten aufgrund ihrer umfangreichen Datenbasis bevorzugte Behandlung. Der wachsende regulatorische Druck aus der EU könnte jedoch finanzielle Anreize schaffen, die Sprachunterstützung zu erweitern.Dieser Bericht basiert auf Informationen von Global Voices, lizenziert unter Quelle beachten. Lizenzangabe konnte nicht eindeutig zugeordnet werden.
Ende der Ăśbertragung