Design and Implementation of a Data Warehouse System for Online Analytical Processing of Reviews on University Evaluation Platforms

Autor
C. Schießl
Masterarbeit
MT2501 (Jänner, 2025)
Betreut von
Assoz. Univ.-Prof. Mag. Dr. Christoph Schütz
Ausgeführt an
Universität Linz, Institut für Wirtschaftsinformatik - Data & Knowledge Engineering
Ressourcen
Kopie

Kurzfassung (Deutsch)

Kurzfassung

Diese Arbeit behandelt das Konzept und die Implementierung eines Data-Warehouse-Systems, das Bewertungen aus Bewertungsportalen im Hochschulbereich hinsichtlich der Zufriedenheit der Studierenden mit spezifischen Aspekten der Hochschul-Services auswerten soll.

Mithilfe von BERT und Aspect-Based Sentiment Analysis (ABSA) werden unstrukturierte Texte aus den Bewertungen so aufbereitet, dass sie im Rahmen des Online Analytical Processing (OLAP) analysiert werden können. Das System bietet Hochschuleinrichtungen eine mehrdimensionale Sicht auf die Zufriedenheit der Studierenden, die verschiedene Aspekte wie Studiengänge, Zeiträume und spezifische Hochschul-Services umfasst.

Ein Prototyp des Systems wurde entwickelt, um deutschsprachige Online-Bewertungen von österreichischen Hochschulen zu sammeln, zu verarbeiten und zu analysieren. Es wurde gezeigt, wie ABSA wertvolle Einblicke in die Meinungen der Studierenden liefern kann, die der Hochschulverwaltung helfen können, die Bindung und Rekrutierung von Studierenden zu verbessern. Die Fähigkeit des Systems, große Mengen unstrukturierter Daten zu sammeln und zu analysieren, eröffnet neue Möglichkeiten für eine datengestützte Entscheidungsfindung im Hochschulbereich. Während des Projekts traten mehrere Einschränkungen auf, wie die begrenzte Abdeckung von Aspekt-Kategorien und die Schwierigkeit, komplexe sprachliche Merkmale wie Ironie und Sarkasmus zu berücksichtigen. Zukünftige Arbeiten könnten sich darauf konzentrieren, die Zuverlässigkeit des Systems durch die Erweiterung der Datenquellen, die Integration von Topic-Modeling-Techniken wie Latent Dirichlet Allocation (LDA) und die Verbesserung des Umgangs mit kontextuellen Nuancen zu erhöhen. Darüber hinaus könnte eine Anpassung der Aspekt-Kategorien an spezifische Kurse oder Studiengänge die Genauigkeit der Analyse weiter steigern.

Diese Arbeit liefert eine Grundlage für die Automatisierung der Analyse von Studenten-Feedback und schafft die Voraussetzungen für zukünftige Forschungen zur Verfeinerung und Erweiterung der Fähigkeiten des Systems.

Kurzfassung (Englisch)

Abstract

This thesis presents the design and implementation of a data warehouse system aimed at analyzing student sentiment in online reviews from university evaluation platforms. By applying Aspect-Based Sentiment Analysis (ABSA) using BERT, the system transforms unstructured textual data into a structured format suitable for analysis through Online Analytical Processing (OLAP). The system offers Higher Education Institutions (HEIs) a multidimensional view of student satisfaction, focusing on aspects such as study programs, time periods, and specific attributes of the educational experience.

A prototype system was developed to collect, preprocess, and analyze German-language online reviews related to Austrian universities. It demonstrated how ABSA can provide actionable insights into student feedback, which can assist HEI administrators in improving student retention and recruitment efforts. The system’s ability to analyze large volumes of unstructured data opens up new possibilities for data-driven decision-making in academia.

Several limitations were encountered during the project, such as the restricted coverage of aspect categories and the difficulty in addressing complex linguistic features, i.e., irony and sarcasm. Future work could focus on increasing the system’s reliability by expanding data sources, integrating topic modeling techniques, i.e., Latent Dirichlet Allocation (LDA), and improving the handling of contextual nuances. In addition, adapting the aspect categories to specific courses or programs could further enhance the accuracy of the analysis.

This thesis provides a foundation for automating student feedback analysis at HEIs and sets the stage for future research to refine and expand the system’s capabilities.