Indexing Encrypted XML Documents in the SemCrypt Database Management System

Autor
P. Lasinger
Masterarbeit
MT0601 (Juli, 2006)
Betreut von
o. Univ.-Prof. Dr. Michael Schrefl
Angeleitet von
Mag. Katharina Grün
Mag. Michael Karlinger
Ausgeführt an
Universität Linz, Institut für Wirtschaftsinformatik - Data & Knowledge Engineering
Ressourcen
Kopie

Kurzfassung (Englisch)

Index structures are one of the most efficient and most common methods to gain access to large amounts of data. Consequently they are closely interconnected with database management systems. Several index structures exist, which are optimized for special data or specific applications and which enable a targeted and fast access to data.

The SemCrypt research project addresses the database oriented management of XML documents in an outsourcing environment with encrypted data. The reduced availability of this data requires index structures to speed up the access.

So far no frameworks exist which speeds up accesses to the encrypted data and enables the integrative management and use of different index structures in XML database management systems (DBMS). This thesis proposes an extensible and flexible indexing framework for the SemCrypt DBMS. By abstracting from specific index structures, it is possible to manage different index structures in a uniform way, as well as to extend existing or to implement new index structures. Independence from the kind of data storage is reached by abstracting from the storage structure, which is important to meet the security requirements of SemCrypt.

This thesis describes how well known index structures can be adapted and extended, so that they can be used in the SemCrypt DBMS environment, without threatening the system's overall security. Furthermore a new approach to index data in dynamic hierarchies is presented. By extending the concepts of XML and object oriented indexing it is possible to arbitrarily nest index structures. This facilitates the combination of different capabilities of the presented index structures and unites the search for values and structural information.

The remaining part of the thesis describes how the presented concepts and index structures are implemented. Finally the implemented index structures are evaluated using qualitative criteria and performance tests.

Kurzfassung (Deutsch)

Indexstrukturen sind eine der effizientesten und verbreitesten Methoden um Abfragen auf großen Datenmengen zu ermöglichen. Dadurch stehen sie stets in einem engen Zusammenhang mit Datenbanksystemen. Es existieren zahlreiche Indexstrukturen, die mit speziellen Daten verwendet werden können, beziehungsweise in gewissen Anwendungsfällen den gezielten und schnellen Datenzugriff ermöglichen.

Das SemCrypt Forschungsprojekt befasst sich mit der Verwaltung und Speicherung von XML Daten in einem Outsourcing Umfeld und mit verschlüsselten Daten. Diese Umgebung beeinträchtigt die Verfügbarkeit der Daten und erfordert Indexstrukturen, um einen effizienten Zugriff zu ermöglichen.

Bisher existieren keine Ansätze, um Indexsstrukturen in einem XML Datenbanksystem einheitlich zu verwalten und zu verwenden. Um dies, sowie das Erweitern und Hinzufügen von Indexstrukturen im SemCrypt Datenbanksystem zu ermöglichen, wird ein Indexverwaltungssystem vorgestellt und entwickelt. Durch die Abstraktion von konkreten Indexstrukturen erlaubt dieses eine einfache Verwaltung und eine einheitliche Verarbeitung von verschiedenen Indexstrukturen. Durch Abstraktion von der Speicherstruktur wird weiters Unabhängigkeit von der Art der Speicherung erreicht.

Diese Arbeit beschreibt, wie bekannte Indexstrukturen adaptiert und erweitert werden können, um sie im SemCrypt Datenbanksstem einzusetzen, ohne die Sicherheit des Gesamtsystems zu gefährden. Des weiteren wird ein neuer Index vorgestellt, der die Indizierung von dynamischen Hierarchien erlaubt. Um beliebige Indexstrukturen verschachteln zu können, werden Konzepten aus dem Umfeld der Indizierung von XML und objektorientierten Daten erweitert.
Das ermöglicht die Kombination der Fähigkeiten vorgestellter Indexstukturen und eine Vereinigung der Suche nach Werten und struktureller Information.

Diese Arbeit stellt nicht nur Konzepte zur Indizierung von verschlüsselten XML Dokumenten vor, sondern erläutert auch ihre prototypische Implementierung. Abschließend werden die implementierten Indexstrukturen anhand von qualitativen Kriterien und quantitativ, mittels durchgeführter Performancetests, evaluiert.