SQL (Structured Query Language) ist eine Datenbanksprache, welche zur Definition von Datenstrukturen in relationalen Datenbanken sowie zur Abfrage und Bearbeitung von Datenbeständen der Datenbank genutzt wird.
Besuche die App, um alle Inhalte zu sehen!
Erklärung
Um Informationen dauerhaft zu speichern, werden Datenbanksysteme verwendet. Ein Datenbanksystem besteht dabei immer aus dem Datenbankmanagementsystem (DBMS) und der Datenbank.
Wofür SQL?
Damit das DBMS mit der Datenbank kommunizieren kann, wird bei relationalen Datenbanken (also Datenbanken, die auf der relationalen Algebra aufbauen) SQL verwendet. Dabei bietet die Datenbanksprache SQL folgende drei wichtige Funktionalitäten:
- Tabellen in der Datenbank erzeugen
- Einträge in Tabellen bearbeiten
- Datensätze abfragen
Eine relationale Datenbank ist eine Sammlung von Tabellen (den Relationen). Diese Tabellen haben Spalten und Zeilen.
- Die Tabellen-Spalten werden als Attribute bezeichnet und sind durch ihren Namen klassifiziert. (Orange)
- Eine Tabellen-Zeile ist ein Datensatz und wird auch Tupel genannt. (Blau)
- Ein Wert in einem Feld der Tabelle wird Attributwert genannt. (Grün)
Schlüssel in Datenbanken
- Damit Tupel (Zeilen) in einer Relation (Tabelle) eindeutig identifiziert werden können, wird ein Schlüssel benötigt.
- Der Schlüssel besteht dabei aus einem/mehreren Attribut/en (Spalten).
- Die Attribute werden so gewählt, dass alle Attributwerte der Tupel über die zugehörigen Attribute eine einzigartige Kombination ergeben.
Ein (Primär-)Schlüssel muss dabei drei Anforderungen entsprechen:
- Eindeutigkeit: Ein Schlüssel muss so gewählt sein, dass jedes Tupel der Tabelle eindeutig identifiziert wird.
- Minimalität: Die Anzahl an Attributen für einen Schlüssel muss möglichst klein sein. Der Schlüssel darf also keine unnötigen Attribute enthalten.
- Definiertheit: Ein jeder Attributwert der zum Schlüssel gehörigen Attribute muss für alle Tupel definiert sein. Einträge, die in Schlüsselspalten stehen, dürfen also nicht leer sein.
Primärschlüssel
Die für den Schlüssel einer Tabelle ausgewählte Menge an Attributen wird Primärschlüssel genannt. Der Primärschlüssel muss die drei oben genannten Eigenschaften erfüllen. Um den Primärschlüssel in einer Tabelle zu kennzeichnen, werden die zum Schlüssel gehörigen Attribute unterstrichen:
In diesem Beispiel ist der Primärschlüssel aus den Attributen Vorname und Nachname zusammengesetzt. Dies ist zulässig, da in der Beispieltabelle jede Kombination aus Vorname und Nachname eindeutig ist!
Aber Vorsicht: Wenn weitere Personen eingefügt werden, kann es jedoch passieren, dass die Kombination aus Vorname und Nachname nicht mehr eindeutig ist. Daher benutzt du hier am besten einen ...
Surrogatschlüssel (künstlicher Schlüssel)
Ein Surrogatschlüssel (auch künstlicher Schlüssel, synthetischer Schlüssel oder Ersatzschlüssel genannt) wird immer genau dann verwendet, wenn du nicht sicherstellen kannst, dass der Primärschlüssel immer eindeutig sein wird, egal welche Datensätze eingefügt werden. Ein Surrogatschlüssel ist daher meist eine fortlaufende künstlich angelegte Nummer, welche uns die Eindeutigkeit garantiert. Der Surrogatschlüssel ist somit ein spezieller Primärschlüssel, bestehend aus einem künstlich angelegten Attribut.
In diesem Beispiel könnte das so aussehen:
Fremdschlüssel
Ein Fremdschlüssel ist ein Attribut, welches auf den Primärschlüssel einer anderen Tabelle verweist. Um den Fremdschlüssel zu kennzeichnen, wird dieser überstrichen:
Der Fremdschlüssel Wohnort aus der Tabelle Personen verweist dabei auf den Primärschlüssel StadtID der Tabelle Städte:
Beispiel
Im folgenden Beispiel werden die Tabellen der Datenbank einer Schule betrachtet. Es gibt die Tabelle "Klassen" und die Tabelle "Lehrkräfte":
Wichtig: Es gibt unterschiedliche Möglichkeiten, wie Datenbanken modelliert werden können! Daher ist das folgende Beispiel nur eine Möglichkeit von vielen.
Die Aufgabe ist es, die Tabellen so anzupassen, dass sie in der Datenbank alle Anforderungen erfüllen. Dazu muss zunächst in beiden Tabellen ein Primärschlüssel festgelegt werden.
Da das Klassenkürzel (z.B. 7b) an einer Schule eindeutig ist, handelt es sich hierbei um einen geeigneten Primärschlüssel. Anders sieht es bei den Lehrkräften aus. Bei der Kombination aus Vor- und Nachnamen kann NICHT sichergestellt werden, dass diese Kombination immer eindeutig bleibt. Also muss ein Surrogatschlüssel eingeführt werden:
Jetzt haben beide Tabellen eindeutig definierte Primärschlüssel. Allerdings fällt auf, dass die Klassenleiter "Franklin" NICHT unterschieden werden können. Bei den Klassenleitern "Franklin" könnte es sich um "Rosalind Franklin" oder "Benjamin Franklin" handeln. Um dies zu vermeiden, muss das Attribut Kassenleiter als Fremdschlüssel definiert werden. Dieser Fremdschlüssel verweist auf den eindeutigen Primärschlüssel der Tabelle "Lehrkräfte" und ermöglicht die Unterscheidung, da der Primärschlüssel von Lehrkräfte wiederum eindeutig ist:
Nun sind alle Bedingungen erfüllt und die Tabellen sind fertig.