Forschung | 6. November 2025
Die HWZ präsentiert jährlich eine Auswahl der besten Abschlussarbeiten in Form eines «Best of Bachelor Theses» Booklet. Im Bachelor Wirtschaftsinformatik an der HWZ entwickelte Lilian Bühler ein Machine-Learning-Modell zur Unterstützung von Unternehmen bei der Einhaltung des Datenschutzgesetzes. Wie es dazu kam und worum es in ihrer Arbeit ging, erzählt sie im Interview.


Thema: Klassifizierung von Personendaten mittels Machine Learning: Entwicklung eines Named Entity Recognition Modells zur Unterstützung der Konformität von Unternehmen mit dem DSG und der DSGVO
Betreuungsperson: Fabian Schöni
Note: Die methodisch innovative und stark praxisorientierte Arbeit, erhielt die Note 5.9.
Liebe Lilian, herzliche Gratulation zur «Best of Bachelor Theses» Würdigung! Worüber hast du deine Abschlussarbeit im Bachelor Wirtschaftsinformatik HWZ geschrieben?
Vielen Dank! In meiner Arbeit ging es darum, ein Machine-Learning-Modell zu entwickeln, das personenbezogene Daten in Texten erkennen kann. Das Ziel des Modells war, Unternehmen bei der Einhaltung von Datenschutzgesetzen wie dem DSG und der DSGVO zu unterstützen.
Auf welchen Teil deiner Thesis bist du besonders stolz und warum?
Besonders stolz bin ich auf den praktischen Teil. Ich hatte vorher noch keine Erfahrung mit Named Entity Recognition und konnte mir im Rahmen meiner Arbeit mein Wissen selbst erarbeiten. Es hat mich sehr gefreut, dass das Training des Modells so gut funktioniert hat.
Was hat dich dazu inspiriert, dieses Thema zu wählen?
Bei meiner täglichen Arbeit betreue ich die technischen Aspekte eines Data Loss Prevention Systems. Daher war es für mich besonders spannend zu untersuchen, wie sich Künstliche Intelligenz in diesem Bereich einsetzen lässt und wie die Ergebnisse im Vergleich zu bestehenden Herstellersystemen aussehen (der Vergleich war allerdings nicht Teil der Bachelor Thesis).
Was waren für dich die grössten Erkenntnisse aus deiner Arbeit?
Wie wichtig qualitativ hochwertige und vielfältige Trainingsdaten für Machine-Learning Modelle sind. Zudem habe ich gelernt, wie komplex es ist, personenbezogene Daten maschinell mit grosser Variation zu erzeugen.
Was waren die Herausforderungen bei der Weiterentwicklung des Named Entity Recognition Modells?
Die grösste Herausforderung lag in der Erstellung synthetischer Trainingsdaten. Da ich keine realen personenbezogenen Daten verwenden konnte, musste ich ein Verfahren entwickeln, um realistische, aber fiktive Datensätze zu generieren.
Die Bachelorarbeit von Lilian Bühler verdient die Auszeichnung «Best of Bachelor Thesis», da sie ein sehr aktuelles und komplexes Thema an der Schnittstelle von Datenschutz und Künstlicher Intelligenz technisch fundiert, methodisch sauber und mit hoher Eigenleistung umgesetzt hat. Sie zeigt, wie Machine Learning Unternehmen bei der Einhaltung von Datenschutzvorgaben unterstützen kann und verbindet theoretisches Wissen mit einer überzeugenden praktischen Umsetzung.
Welche Methodik hast du in deiner Bachelorarbeit verwendet, um auf deine Forschungsergebnisse zu kommen?
Ich habe meine Arbeit nach dem CRISP-DM-Modell aufgebaut, einem etablierten Vorgehensmodell für Data-Science-Projekte. Es hat mir geholfen, strukturiert vorzugehen: von Datenaufbereitung bis hin zur Modellierung und Evaluation.

Lilian, weisst du noch, weshalb du dich damals für den Bachelor Wirtschaftsinformatik an der HWZ entschieden hast?
Mir war wichtig, mich beruflich zukunftsorientiert aufzustellen. Da ich ursprünglich keine IT-Ausbildung hatte, war ein klassisches Informatikstudium für mich keine Option. Wirtschaftsinformatik bot die perfekte Verbindung zwischen meiner bisherigen Erfahrung als Bankkauffrau und meinem Interesse an Technologie.
Wovon hast du während des Studiums am meisten profitiert? Standest du zu Beginn des Studiums an einem anderen Punkt wie jetzt nach deinem Abschluss?
Durch das Studium hatte ich die Möglichkeit meinen Job zu wechseln und dadurch in eine völlig neue Welt einzutauchen. Vor dem Studium hatte ich kaum Berührungspunkte mit Informatik, heute arbeite ich als Engineer in der IT. Das Studium und die Unterstützung in meinem Umfeld haben mir diesen Wechsel ermöglicht und ich konnte sehr viel Wissen direkt in die Praxis übertragen.
Was sind deine zukünftigen Pläne mit deinem trainierten Modell? Möchtest du es weiterentwickeln?
Nein, aktuell plane ich keine Weiterentwicklung. Das Modell wäre bereit für eine Validierung mit realen Daten, aber zurzeit ist das kein Thema.
Welchen Rat würdest du denjenigen geben, die vor der Herausforderung ihrer Bachelorarbeit stehen?
Dranbleiben ist das Wichtigste. Manchmal hilft es, einen Schritt zurückzutreten und dich zu fragen, was das eigentliche Ziel der Arbeit ist. So behältst du den Fokus und kannst deine Energie gezielt einsetzen.
HWZ Hochschule für Wirtschaft Zürich Lagerstrasse 5, Postfach, 8021 Zürich +41 43 322 26 00
ImpressumDatenschutzRechtliches