Schemaintegration für den Entwurf Föderierter Datenbanken

Ingo Schmitt

Zusammenfassung
Datenbanksysteme werden in der heutigen Zeit erfolgreich zur effizienten Verwaltung großer Datenmengen eingesetzt. Dabei erfolgt die Nutzung der Datenbanktechnologie oft im Rahmen einzelner Insellösungen. Föderierte Datenbanksysteme sollen durch die logische Zusammenfassung heterogener Datenbanksysteme helfen, dem Ziel der Datenintegration, also der zentralen und redundanzfreien Verwaltung von Daten näher zu kommen. Eine Föderierte Datenbank muß, wie jede andere Datenbank auch, entworfen werden. Typisch für den Entwurf einer Föderierten Datenbank ist die Integration der Schemata der zu föderierenden Datenbanken. Eine solche Schemaintegration muß Heterogenität zwischen den Schemata überwinden. Dieser Prozeß ist im allgemeinen sehr kompliziert und kann nur teilweise automatisiert werden. Eine Methode zur Schemaintegration vereinfacht diesen Prozeß. Innerhalb einer solchen Methode wird unter anderem festgelegt, in welches gemeinsame Datenmodell die zu integrierenden Schemata zu überführen sind, bevor die Schemaheterogenität behandelt wird. Dieses Datenmodell, welches oft kanonisches Datenmodell genannt wird, hat einen großen Einfluß auf die Art der Schemakonflikte und deren Auflösung. In der vorliegenden Arbeit wird eine Methode zur Schemaintegration vorgestellt. Im Gegensatz zu den meisten Entwurfsmethoden wird hier jedoch kein GIM Objektmodell als kanonisches Datenmodell verwendet. Statt dessen schlagen wir die Verwendung des Entwurfsmodells  vor, das speziell auf die Schemaintegration zugeschnitten wurde. Aufgrund der Verwendung dieses Datenmodells können Schemakonflikte systematischer als in anderen Integrationsmethoden klassifiziert werden. Die systematische Behandlung der Schemakonflikte ermöglicht den Einsatz von Algorithmen, die den Entwurfsprozeß erheblich vereinfachen. Der in dieser Arbeit vorgestellte Algorithmus generiert die Klassen eines resultierenden Schemas mit entsprechenden Spezialisierungsbeziehungen. Dabei werden auch bestimmte Integritätsbedingungen und Referenzattribute berücksichtigt. Durch gezielte Einflußnahme kann der Entwerfer die Generierung eines resultierenden Schemas beeinflussen und somit unterschiedliche Sichten erzeugen. Die in dieser Arbeit vorgestellte Integrationsmethode umfaßt die überführung der zu integrierenden Schemata in das Datenmodell GIM, die Auflösung der Schemakonflikte und die anschließende Ableitung externer Schemata. Die einzelnen Schritte der Integrationsmethode werden anhand von Beispielen erklärt und überwiegend formal beschrieben. Die Ableitung externer Schemata ist in der Regel mit einem Datenmodellwechsel in ein beliebiges Datenmodell verbunden. Die in dieser Arbeit beschriebene Methode zur Schemaintegration und deren Algorithmen legen keine konkreten Datenmodelle für die Ausgangs- und die resultierenden Schemata fest. Das Datenmodell GIM spielt nur zur Zwischenrepräsentation der Schemata während der Schemaintegration eine Rolle.

This website uses cookies. There are two types of cookies: The first type supports the basic functionality of our website. The second allows us to improve our content for you by saving and analyzing pseudonymised user data. Since this second type is technically not required to run the website, you can withdraw your consent to those cookies at any time. For more information please visit our pages on data protection.

Mandatory

These cookies are needed for a smooth operation of our website.

Statistic

For statistical reasons, we use the platform Matomo to analyse the user flow with the help of website users‘ pseudonymised data. This allows us to optimize website content.

Name Purpose Lifetime Type Provider
_pk_id Used to store a few details about the user such as the unique visitor ID. 13 months HTML Matomo
_pk_ref Used to store the attribution information, the referrer initially used to visit the website. 6 months HTML Matomo
_pk_ses Short lived cookie used to temporarily store data for the visit. 30 minutes HTML Matomo