顿补迟别苍辩耻补濒颈迟盲迟 in User-Generated Content (DQUGC)

Projektteam

Prof. Dr. Mathias Klier
Dr. Andreas Obermeier
Lukas H盲gele
Hannah Knehr
Anna-Lena Kubillus
Mike Rotheh盲usler
Christian Sparn

Kontakt

Prof. Dr. Mathias Klier
+49 (0) 7 31 50-3 23 12
mathias.klier(at)uni-ulm.de

Textuelle nutzergenerierte Inhalte (User-Generated Content, UGC) wie bspw. Kundenrezensionen, Wiki-Beitr盲ge oder Social-Media-Posts bilden heute eine zentrale Grundlage f眉r datengetriebene Anwendungen. Sp盲testens mit dem breiten Einsatz generativer KI-Systeme wie ChatGPT und anderer Large Language Models ist deutlich geworden, wie stark die Leistungsf盲higkeit moderner KI von der Qualit盲t textueller Daten abh盲ngt. Unzureichende 顿补迟别苍辩耻补濒颈迟盲迟 kann dabei nicht nur die G眉te von Analyseergebnissen beeintr盲chtigen, sondern auch zu Verzerrungen, Instabilit盲t und schwer nachvollziehbaren Entscheidungen f眉hren.

Das von der Deutschen Forschungsgemeinschaft (DFG) gef枚rderte Projekt DQUGC ist ein Folgeprojekt des Vorhabens DQNGI und wird im Rahmen eines DFG-Fortsetzungsantrags durchgef眉hrt. Im Vorg盲ngerprojekt wurde mit einer Ver枚ffentlichung in ein zentraler konzeptioneller Beitrag zur Messung von 顿补迟别苍辩耻补濒颈迟盲迟 geleistet: Erstmals wurde gezeigt, wie Ereignisse (Events) als Ursachen von 顿补迟别苍辩耻补濒颈迟盲迟sproblemen explizit modelliert und 眉ber charakteristische Muster in den Daten identifiziert werden k枚nnen. Am Beispiel von Duplikaten wurde ein ereignisgetriebener Ansatz entwickelt, der 顿补迟别苍辩耻补濒颈迟盲迟 nicht rein syntaktisch, sondern 眉ber event-spezifische Datenmuster probabilistisch messbar macht.

DQUGC greift diesen Event-basierten Ansatz gezielt auf und entwickelt ihn weiter. Ziel des Projekts ist es, das Konzept der ereignisgetriebenen 顿补迟别苍辩耻补濒颈迟盲迟smessung auf weitere Arten textueller Daten sowie auf zus盲tzliche 顿补迟别苍辩耻补濒颈迟盲迟sdimensionen jenseits von Duplikaten auszurollen. DQUGC zielt dabei verst盲rkt auf unstrukturierte, textuelle Inhalte, wie sie in UGC und Trainingsdaten moderner KI-Systeme vorliegen.

Ein zentraler Schwerpunkt liegt darauf zu untersuchen, wie sich Event-Bez眉ge und daraus abgeleitete 顿补迟别苍辩耻补濒颈迟盲迟sinformationen systematisch in maschinelle Lernverfahren integrieren lassen. Dies umfasst unter anderem die Nutzung von Qualit盲tsinformationen zur Gewichtung, Auswahl oder Vorverarbeitung von Trainingsdaten sowie zur Interpretation von Modellergebnissen. Damit adressiert das Projekt grundlegende Herausforderungen aktueller GenAI-Systeme.

Die in DQUGC entwickelten Ans盲tze sind sowohl f眉r die wissenschaftliche Forschung im Bereich 顿补迟别苍辩耻补濒颈迟盲迟, Textanalyse und maschinelles Lernen relevant als auch f眉r Praxispartner interessant, die gro脽e Mengen textueller Daten oder KI-basierte Systeme einsetzen. Gleichzeitig bietet das Projekt Studierenden die M枚glichkeit, sich im Rahmen von Abschlussarbeiten und Forschungsprojekten mit aktuellen Fragestellungen an der Schnittstelle von 顿补迟别苍辩耻补濒颈迟盲迟, Events und moderner KI auseinanderzusetzen.

Die Universit盲t Ulm verfolgt in Kooperation mit der Universit盲t Regensburg dabei folgende Forschungsfragen:

Wie l盲sst sich 顿补迟别苍辩耻补濒颈迟盲迟 in textuellen nutzergenerierten Inhalten ereignisgetrieben automatisiert messen und verbessern?
Wie lassen sich 顿补迟别苍辩耻补濒颈迟盲迟sinformationen methodisch fundiert in maschinelle Lernverfahren und GenAI-Modelle integrieren?

Kooperationspartner: Universit盲t Regensburg

贵枚谤诲别谤驳别产别谤: Deutsche Forschungsgemeinschaft (DFG)

Projektzeitraum: bis 2027

黑料传送门

顿补迟别苍辩耻补濒颈迟盲迟 in User-Generated Content (DQUGC)