Ein neues Tool namens Mumtathil bewertet automatisch die Übereinstimmung arabischer Datenschutzerklärungen mit dem saudischen Personal Data Protection Law (PDPL). Das System nutzt Mehrfach‑Label‑Klassifikation und erreicht laut einer im Fachjournal PLOS ONE veröffentlichten Studie eine F‑Score‑Bewertung von 92 %.
Hintergrund des saudischen Datenschutzgesetzes
Der PDPL, der 2022 in Kraft trat, soll den Umgang mit personenbezogenen Daten auf Webseiten und in Apps regulieren. Seit seiner Einführung fordern Unternehmen und Behörden zunehmend nachweisbare Konformität, um rechtliche Risiken zu minimieren.
Probleme manueller PrĂĽfungen
Manuelle Analysen von Datenschutzerklärungen erfordern umfangreiche juristische Expertise und viel Zeit. Forschende weisen darauf hin, dass solche Verfahren häufig kostenintensiv und fehleranfällig sind, insbesondere bei der Vielzahl an Online‑Diensten.
Entwicklung von Mumtathil
Die Entwickler des Tools kombinierten Mehrfach‑Label‑Klassifikation mit maschinellen Lernverfahren, um einzelne Vorgaben des PDPL in Texten zu erkennen. Dabei kamen sowohl klassische Algorithmen als auch transformer‑basierte Modelle wie CamelBERT und AraBERT zum Einsatz.
Datensatz‑Erweiterung
Um das Ungleichgewicht im Trainingsmaterial zu reduzieren, erweiterten die Forscher den Saudi Privacy Policy Dataset durch aktuelle Datenschutzerklärungen und synthetische Beispiele, die mithilfe von ChatGPT generiert wurden. Diese Vorgehensweise steigerte die Datenvielfalt und verbesserte die Lernfähigkeit des Systems.
Ergebnisse und Vergleich
In den Tests übertraf das Support Vector Machine‑Modell sämtliche anderen Verfahren, einschließlich der transformer‑basierten Varianten, und erreichte den genannten F‑Score von 92 %. Die Resultate belegen, dass klassische Lernmethoden bei strukturierten rechtlichen Texten konkurrenzfähig bleiben.
Bedeutung fĂĽr Praxis und Ausblick
Durch die Automatisierung reduziert Mumtathil den Aufwand für Compliance‑Prüfungen erheblich, was Unternehmen ermöglicht, schneller auf regulatorische Anforderungen zu reagieren. Die Autoren planen, das System auf weitere Rechtsrahmen auszudehnen und die Integration in regulatorische Überwachungsplattformen zu prüfen.
Dieser Bericht basiert auf Informationen von PLOS ONE, lizenziert unter Creative Commons BY 4.0 (Open Access). Wissenschaftliche Inhalte, offen zugänglich.
Ende der Ăśbertragung