Covering or Complete? von Jana Bauckmann | Discovering conditional inclusion dependencies | ISBN 9783869562124

Covering or Complete?

Discovering conditional inclusion dependencies

von Jana Bauckmann, Ziawasch Abedjan, Ulf Leser, Heiko Müller und Felix Naumann
Mitwirkende
Autor / AutorinJana Bauckmann
Autor / AutorinZiawasch Abedjan
Autor / AutorinUlf Leser
Autor / AutorinHeiko Müller
Autor / AutorinFelix Naumann
Buchcover Covering or Complete? | Jana Bauckmann | EAN 9783869562124 | ISBN 3-86956-212-9 | ISBN 978-3-86956-212-4

Covering or Complete?

Discovering conditional inclusion dependencies

von Jana Bauckmann, Ziawasch Abedjan, Ulf Leser, Heiko Müller und Felix Naumann
Mitwirkende
Autor / AutorinJana Bauckmann
Autor / AutorinZiawasch Abedjan
Autor / AutorinUlf Leser
Autor / AutorinHeiko Müller
Autor / AutorinFelix Naumann
Datenabhängigkeiten (wie zum Beispiel Integritätsbedingungen), werden verwendet, um die Qualität eines Datenbankschemas zu erhöhen, um Anfragen zu optimieren und um Konsistenz in einer Datenbank sicherzustellen. In den letzten Jahren wurden bedingte Abhängigkeiten (conditional dependencies) vorgestellt, die die Qualität von Daten analysieren und verbessern sollen. Eine bedingte Abhängigkeit ist eine Abhängigkeit mit begrenztem Gültigkeitsbereich, der über Bedingungen auf einem oder mehreren Attributen definiert wird. In diesem Bericht betrachten wir bedingte Inklusionsabhängigkeiten (conditional inclusion dependencies; CINDs). Wir generalisieren die Definition von CINDs anhand der Unterscheidung von überdeckenden (covering) und vollständigen (completeness) Bedingungen. Wir stellen einen Anwendungsfall für solche CINDs vor, der den Nutzen von CINDs bei der Lösung komplexer Datenqualitätsprobleme aufzeigt. Darüber hinaus definieren wir Qualitätsmaße für Bedingungen basierend auf Sensitivität und Genauigkeit. Wir stellen effiziente Algorithmen vor, die überdeckende und vollständige Bedingungen innerhalb vorgegebener Schwellwerte finden. Unsere Algorithmen wählen nicht nur die Werte der Bedingungen, sondern finden auch die Bedingungsattribute automatisch. Abschließend zeigen wir, dass unser Ansatz effizient sinnvolle und hilfreiche Ergebnisse für den vorgestellten Anwendungsfall liefert.