Kontextbasierte Textanalyse und -filterung in Echtzeitkommunikationsumgebungen: Die Rolle von Large Language Models (LLM) AI

  • Ziel dieser Masterarbeit ist die Entwicklung eines fortschrittlichen Modells zur kontextbasierten Erkennung und Filterung von Hassrede in der deutschen Sprache. Die Arbeit geht auf die Einschränkungen bestehender Modelle ein, die vorwiegend für englischsprachige Daten konzipiert sind, und passt moderne Techniken der natürlichen Sprachverarbeitung (NLP) an die sprachlichen und kulturellen Besonderheiten des Deutschen an. Im Fokus steht die Bewältigung der Herausforderungen, die mit der Kontextidentifikation in Textkommunikationen, insbesondere in sozialen Medien und anderen Echtzeitkommunikationsumgebungen, verbunden sind. Ziel ist es, die Defizite traditioneller, schlüsselwortbasierter Ansätze zu überwinden. Die Methodik umfasste eine umfangreiche Datenvorverarbeitung, die Einbindung von Konversationshistorien zur Erfassung des Kontexts sowie das Fine-Tuning eines vortrainierten Large Language Models (LLM). Eine systematische Evaluierung anhand von Metriken wie Accuracy, Precision, Recall und F1-Score zeigte signifikante Verbesserungen gegenüber Basismodellen. Die Ergebnisse unterstreichen die Bedeutung des Kontexts, um die Klassifikationsgenauigkeit zu erhöhen und falsch-positive sowie falsch-negative Ergebnisse zu minimieren. Diese Forschung liefert einen robusten und anpassungsfähigen Rahmen für die Hassredeerkennung in der deutschen Sprache und trägt sowohl zu wissenschaftlichen Fortschritten als auch zu praktischen Anwendungen bei. Potenzielle Einsatzbereiche umfassen die Inhaltsmoderation auf sozialen Medienplattformen, die Echtzeitfilterung in Kommunikationswerkzeugen und andere Domänen, die eine effiziente und skalierbare Textanalyse erfordern. Die Ergebnisse verdeutlichen die Notwendigkeit, kontextsensitive Modelle weiter zu erforschen, um die Herausforderungen moderner digitaler Kommunikation zu bewältigen.
  • The objective of this master’s thesis was to develop an advanced model for the contextbaseddetection and filtering of hate speech in the German language. The study addressesthe limitations of existing models, which are primarily tailored to English-language data, andadapts modern natural language processing (NLP) techniques to meet the linguistic andcultural nuances of German. By focusing on the challenges of identifying context in textualcommunication, especially in social media and other real-time communication environments,this work aims to overcome the deficiencies of traditional keyword-based approaches.The methodology involved extensive data preprocessing, the integration of conversation his-tory to capture context, and the fine-tuning of a pre-trained large language model (LLM). Asystematic evaluation using metrics such as accuracy, precision, recall, and F1-score demonstrated significant improvements over baseline models. The results highlight the im-portance of context in increasing classification accuracy and minimizing false positives and negatives. This research provides a robust and adaptable framework for hate speech detection in the German language, contributing to both academic advancements and practical ap-plications. Potential use cases include content moderation on social media platforms, real-time filtering in communication tools, and other domains requiring efficient, scalable text anal-ysis. These findings underline the necessity of further exploring context-sensitive models to address the complexities of modern digital communication.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author(s):Emmanuel Seusek
DOI:https://doi.org/10.58023/1124
Subtitle (German):Eine Untersuchung zur Effektivität und Integration von fortgeschrittenen KI-Technologien zur Erkennung und Blockierung unangemessener Inhalte
Document Type:Master's Thesis
Language:German
Year of Publication:2024
Publishing Institution:FH CAMPUS 02 (CAMPUS 02 Fachhochschule der Wirtschaft)
Granting Institution:FH CAMPUS 02 (CAMPUS 02 Fachhochschule der Wirtschaft)
Release Date:2025/06/14
GND Keyword:Künstliche IntelligenzGND; HassredeGND
Page Number:vi, 75
Institutes:Informationstechnologien & Wirtschaftsinformatik
Dewey Decimal Classification:6 Technik, Medizin, angewandte Wissenschaften / 65 Management, Öffentlichkeitsarbeit / 658 Allgemeines Management
BKL-Classification:54 Informatik / 54.52 Software engineering
Open Access:ja
Licence (German):License LogoBundesgesetz über das Urheberrecht an Werken der Literatur und der Kunst und über verwandte Schutzrechte (Urheberrechtsgesetz)

$Rev$