Schemaintegration für den Entwurf Föderierter Datenbanken

Ingo Schmitt

Zusammenfassung
Datenbanksysteme werden in der heutigen Zeit erfolgreich zur effizienten Verwaltung großer Datenmengen eingesetzt. Dabei erfolgt die Nutzung der Datenbanktechnologie oft im Rahmen einzelner Insellösungen. Föderierte Datenbanksysteme sollen durch die logische Zusammenfassung heterogener Datenbanksysteme helfen, dem Ziel der Datenintegration, also der zentralen und redundanzfreien Verwaltung von Daten näher zu kommen. Eine Föderierte Datenbank muß, wie jede andere Datenbank auch, entworfen werden. Typisch für den Entwurf einer Föderierten Datenbank ist die Integration der Schemata der zu föderierenden Datenbanken. Eine solche Schemaintegration muß Heterogenität zwischen den Schemata überwinden. Dieser Prozeß ist im allgemeinen sehr kompliziert und kann nur teilweise automatisiert werden. Eine Methode zur Schemaintegration vereinfacht diesen Prozeß. Innerhalb einer solchen Methode wird unter anderem festgelegt, in welches gemeinsame Datenmodell die zu integrierenden Schemata zu überführen sind, bevor die Schemaheterogenität behandelt wird. Dieses Datenmodell, welches oft kanonisches Datenmodell genannt wird, hat einen großen Einfluß auf die Art der Schemakonflikte und deren Auflösung. In der vorliegenden Arbeit wird eine Methode zur Schemaintegration vorgestellt. Im Gegensatz zu den meisten Entwurfsmethoden wird hier jedoch kein GIM Objektmodell als kanonisches Datenmodell verwendet. Statt dessen schlagen wir die Verwendung des Entwurfsmodells  vor, das speziell auf die Schemaintegration zugeschnitten wurde. Aufgrund der Verwendung dieses Datenmodells können Schemakonflikte systematischer als in anderen Integrationsmethoden klassifiziert werden. Die systematische Behandlung der Schemakonflikte ermöglicht den Einsatz von Algorithmen, die den Entwurfsprozeß erheblich vereinfachen. Der in dieser Arbeit vorgestellte Algorithmus generiert die Klassen eines resultierenden Schemas mit entsprechenden Spezialisierungsbeziehungen. Dabei werden auch bestimmte Integritätsbedingungen und Referenzattribute berücksichtigt. Durch gezielte Einflußnahme kann der Entwerfer die Generierung eines resultierenden Schemas beeinflussen und somit unterschiedliche Sichten erzeugen. Die in dieser Arbeit vorgestellte Integrationsmethode umfaßt die überführung der zu integrierenden Schemata in das Datenmodell GIM, die Auflösung der Schemakonflikte und die anschließende Ableitung externer Schemata. Die einzelnen Schritte der Integrationsmethode werden anhand von Beispielen erklärt und überwiegend formal beschrieben. Die Ableitung externer Schemata ist in der Regel mit einem Datenmodellwechsel in ein beliebiges Datenmodell verbunden. Die in dieser Arbeit beschriebene Methode zur Schemaintegration und deren Algorithmen legen keine konkreten Datenmodelle für die Ausgangs- und die resultierenden Schemata fest. Das Datenmodell GIM spielt nur zur Zwischenrepräsentation der Schemata während der Schemaintegration eine Rolle.