Entwicklung eines Multi-Data Warehouse Querytools am Beispiel der Österreichischen Krankenkassen

Autor
U. Feyerl
Masterarbeit
MT0405 (Juni, 2004)
Betreut von
o. Univ.-Prof. Dr. Michael Schrefl
Angeleitet von
Mag. Andreas Bögl
Dipl.-Inf. Anne Hoffmann
Ausgeführt an
Universität Linz, Institut für Wirtschaftsinformatik - Data & Knowledge Engineering

Kurzfassung (Englisch)

The Data Warehouse of the Upper-Austrian Health Insurance Organization (called UDW) will be distributed to the other Health Insurance Organizations in Austria in the middle of 2004. This distribution forces the next development cycle of UDW. Global queries should be enabled. In cause of the distribution, fact-tables will be horizontally fragmented and all dimensions will be allocated redundantly on each site. All local Data Warehouses share the same schema. In addition to the data, UDW includes a query tool to define attributes, constraints and aggregations via an interactive program. Because of the horizontal fragmentation it is possible to execute queries on each site.

This work focuses on the enhancement of the existing query tool to enable distributed query processing on federated data warehouses. The last section of this paper describes a prototype for this query tool.

Kurzfassung (Deutsch)

Das unternehmensweite Data Warehouse (UDW) der Oberösterreichischen Gebietskrankenkasse steht nach der erstmaligen Inbetriebnahme vor dem nächsten Entwicklungsschritt. Mitte des Jahres 2004 erfolgt die österreichweite Verteilung eines Softwareprodukts (Leistungserbringung der Gebietskrankenkasse - LGKK) an die anderen Versicherungsträger. Statistiken die für LGKK erforderlich sind, werden auf Basis des UD Ws erstellt. Eine Verteilung des Data Warehouses ist daher ebenfalls notwendig. Es entsteht daher ein Verteiltes Data Warehouse. Die Datenmodelle der einzelnen Data Warehouses sind alle identisch, da die Quelldaten das Softwareprodukt LGKK zur Verfügung stellt. Dimensionen sind redundant bei allen Versicherungsträger allokiert, Faktentabellen horizontal fragmentiert (nach Versicherungsträger). Zusätzlich zu den Daten im Data Warehouse bietet UDW die
Funktionalität zur Definition von Abfragen. Die gewünschten Attribute, Einschränkungen und Aggregatfunktionen der Abfrage werden mittels mehrerer interaktiver Masken definiert. Die horizontale Fragmentierung erlaubt es, dass jede Abfrage bei jedem Versicherungsträger ausgeführt werden kann.

In der vorliegenden Arbeit wird nach Darlegung des Ist-Zustandes und Erhebung des Forschungsstandes ein Konzept für ein Abfragetool entwickelt, welches es ermöglicht, die Data Warehouses zu einer Föderation zu verbinden. Das neue Abfragetool ermöglicht es, trägerübergreifende- und -vergleichende Abfragen auszuführen. Im letzten Teil der Arbeit wird der Prototyp, welcher zur Prüfung des Konzepts implementiert wurde, beschrieben.