Corso di Informatica (Basi di Dati) Lezione 5 (14 gennaio 2009) Modello Relazionale: vincoli di integrità Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati 1, Prof. Carlo Batini, Laurea in Informatica, AA 2007-2008 1 Vincoli di integrità Le strutture del modello relazionale (viste nella lezione precedente) permettono di organizzare i dati relativi alla realtà di interesse. Non è vero però che qualsiasi istanza su di uno schema (così definito, fino a questo punto) di una Base di Dati rappresenti informazioni corrette per l’applicazione. Si consideri ad esempio la seguente istanza sullo schema di Base di Dati definito nella lezione precedente (con le tre tabelle Studenti, Corsi ed Esami), modificato aggiungendo l’attributo 2 Lode alla tabella Esami. Vincoli di integrità Studenti Matricola Cognome Nome DataNascita 200768 Verdi Fabio 12/02/1972 937653 Rossi Luca 10/10/1971 937653 Bruni Mario 01/12/1971 Lode CodiceCorso 05 01 04 01 Esami MatricolaStudente 200768 937653 937653 276545 Corsi Codice 01 03 04 Voto 36 28 30 25 Titolo Analisi Chimica Chimica lode lode Docente Giani Melli Belli 3 Vincoli di integrità Quali sono gli aspetti scorretti nell’istanza precedente? nella tabella Esami il valore di Voto, in corrispondenza dello studente con matricola 200768, è 36 (e il voto deve essere <= 30!) il valore dell’attributo Lode, per lo studente con matricola 937653, non è nullo nonostante il valore di Voto sia 28 (e la lode si ha solo per un voto pari a 30!) 4 Vincoli di integrità Quali sono gli aspetti scorretti nell’istanza precedente? nella tabella Esami lo studente con matricola 200768 ha sostenuto un esame con codice 05 che però non compare nella tabella Corsi lo studente con matricola 276545 non compare nella tabella Studenti e quindi non si hanno informazioni su di esso nella tabella Studenti ci sono due studenti che hanno lo stesso numero di matricola 5 Vincoli di integrità Un vincolo di integrità è una proprietà che deve essere soddisfatta da tutte le istanze della Base di Dati al fine di rappresentare un’informazione corretta. Un vincolo è un predicato che associa ad un’istanza un valore booleano: VERO se l’istanza è corretta FALSO se l’istanza NON è corretta 6 Vincoli di integrità I vincoli di integrità sono dunque proprietà dello schema, cioè si riferiscono a tutte le istanze dello schema e: permettono una rappresentazione più accurata della realtà contribuiscono alla qualità dei dati, cioè fanno in modo che i dati rappresentino correttamente la realtà portano in fase di progettazione alla definizione di uno schema di qualità 7 Vincoli di integrità I vincoli di integrità sono possono essere di tipo: intrarelazionale, cioè definiti all’interno di una relazione (o tabella) interrelazionale, cioè definiti tra due o più relazioni (o tabelle) 8 Vincoli di integrità I vincoli di tipo intrarelazionale che vedremo sono: vincoli su singolo valore di attributo (o vincoli di dominio) vincoli di ennupla (o di tupla) vincoli di chiave e di chiave primaria Il vincolo di tipo interrelazionale che vedremo è il vincolo di integrità referenziale 9 Vincoli su singolo valore I vincoli su singolo valore coinvolgono un singolo attributo di una relazione. Ad esempio il valore di Voto delle ennuple della tabella Esami, definito sul dominio degli interi, può assumere valori che vanno da 18 a 30. Il vincolo è quindi esprimibile dalla seguente espressione booleana: (Voto >= 18) AND (Voto <= 30) 10 Vincoli di ennupla I vincoli di ennupla coinvolgono l’insieme dei valori di un’intera ennupla di una relazione. Ad esempio le ennuple della relazione Esami devono soddisfare il seguente vincolo: (Voto = 30) OR NOT (Lode = lode) 11 Vincoli su singolo valore e di ennupla Un vincolo su singolo valore o di ennupla è soddisfatto se ogni ennupla dell’istanza della relazione, sulla quale è definito, ha valori che soddisfano il vincolo stesso. 12 Vincoli di chiave e di chiave primaria La motivazione di un vincolo di chiave e di chiave primaria è la necessità di disporre di informazioni che permettano di rappresentare ogni oggetto della realtà di interesse tramite un’unica ennupla. In altre parole si ha la necessità di identificare in maniera univoca le ennuple di una relazione. 13 Definizione di superchiave e di chiave Data una relazione (o tabella) avente schema R(X), dove X è l’insieme degli attributi, un insieme K contenuto in X è una superchiave per R se R non contiene due ennuple distinte t1 e t2 tali che t1[K]= t2[K]. Si dice che K è superchiave minimale (o semplicemente chiave) se non contiene al suo interno nessun’altra superchiave, cioè se nessun sottoinsieme di K è esso stesso una superchiave. 14 Superchiave e chiave (esempi) Nella tabella Studenti3 l’attributo Matricola è una chiave in quanto è una superchiave (non ci sono due studenti con lo stesso numero di matricola) minimale (la superchiave è composta da un solo attributo)... Studenti3 Matricola Cognome Nome Corso DataNascita 276545 485745 200768 Rossi Rossi Neri Mario Mario Piero Ing Inf 5/12/1978 587614 587544 Neri Rossi Mario Piero Ing Mecc 3/11/1976 Ing Mecc 10/07/1979 Ing Inf 3/11/1976 Ing El 5/12/1978 15 Superchiave e chiave (esempi) … L’insieme di attributi (Cognome, Nome, DataNascita) è una superchiave minimale e quindi è un’altra chiave. Infatti nessun altro sottoinsieme di (Cognome, Nome, DataNascita) è una superchiave... Studenti3 Matricola Cognome Nome Corso DataNascita 276545 485745 200768 Rossi Rossi Neri Mario Mario Piero Ing Inf 5/12/1978 587614 587544 Neri Rossi Mario Piero Ing Mecc 3/11/1976 Ing Mecc 10/07/1979 Ing Inf 3/11/1976 Ing El 5/12/1978 16 Superchiave e chiave (esempi) … L’insieme di attributi (Matricola, Cognome, Nome, DataNascita) è una superchiave ma non è una chiave in quanto contiene le due chiavi (Matricola) e (Cognome, Nome, DataNascita). Studenti3 Matricola Cognome Nome Corso DataNascita 276545 485745 200768 Rossi Rossi Neri Mario Mario Piero Ing Inf 5/12/1978 587614 587544 Neri Rossi Mario Piero Ing Mecc 3/11/1976 Ing Mecc 10/07/1979 Ing Inf 3/11/1976 Ing El 5/12/1978 17 Superchiave e chiave (esempi) … L’insieme di attributi (Cognome, Corso) è una chiave. Studenti3 Matricola Cognome Nome Corso DataNascita 276545 485745 200768 Rossi Rossi Neri Mario Mario Piero Ing Inf 5/12/1978 587614 587544 Neri Rossi Mario Piero Ing Mecc 3/11/1976 Ing Mecc 10/07/1979 Ing Inf 3/11/1976 Ing El 5/12/1978 18 Superchiave e chiave NOTA BENE! Data una relazione avente schema R(X), dove X è l’insieme degli attributi, si ha che X è superchiave per definizione. Infatti tutte le ennuple della relazione sono per definizione distinte. 19 Vincolo di chiave Dato uno schema di relazione R(X), un vincolo di chiave su un sottoinsieme K di X, impone che ogni istanza di R(X) deve essere tale che, per ogni coppia di ennuple t1 e t2, si ha t1[K] diverso da t2[K]. 20 Vincolo di chiave (esempio) Sullo schema della tabella Studenti3 si possono definire ad esempio due vincoli di chiave rispettivamente su K1=(Matricola) e su K2=(Cognome,Nome,DataNascita). L’istanza di Studenti3 delle slide precedenti (usata per definire superchiave e chiave) rispetta chiaramente tali due vincoli. L’istanza precedente non rispetterebbe invece un vincolo di chiave definito su K3=(Cognome, Nome) in quanto ci sono due ennuple che su K3 hanno valore (Rossi, Mario) 21 Vincolo di chiave Le chiavi sono importanti perché: permettono di identificare gli oggetti della base di dati accedere agli oggetti della base di dati correlare le informazioni tra relazioni diverse 22 Vincolo di chiave (esempio) La slide successiva riporta la Base di Dati (della lezione precedente) in cui in rosso sono evidenziati il vincolo di chiave definito per la tabella Studenti (sull’attributo Matricola) e quello per la tabella Corsi (sull’attributo Codice). Il legame tra Studenti e Corsi (tabella Esami) avviene grazie alla definizione dei due vincoli di chiave che consentono infatti di legare ogni ennupla di Esami a un’unica ennupla di Studenti e a un’unica ennupla di Corsi. 23 Vincolo di chiave (esempio) Studenti Matricola Cognome Nome DataNascita 276545 Rossi Maria 25/11/1971 485745 Neri Anna 23/04/1972 200768 Verdi Fabio 12/02/1972 587614 Rossi Luca 10/10/1971 Esami MatricolaStudente 276545 276545 200768 Corsi Codice 01 03 04 Voto 28 27 24 Titolo Analisi Chimica Chimica CodiceCorso 01 04 04 Docente Giani Melli Belli 24 Valori nulli In una Base di Dati si ha spesso a che fare con informazione incompleta e quindi con valori nulli. Un valore nullo può essere dovuto al fatto che: il valore esiste ma è sconosciuto (tipo 1) il valore è inesistente (tipo 2) il valore è senza informazione (non si conosce oppure non esiste, non si sa nulla…) (tipo 3) Un DBMS non riesce purtroppo a distinguere il preciso significato di un valore nullo 25 Valori nulli (esempio) Ad esempio si consideri un‘istanza della semplice tabella Prefetture sotto riportata Prefetture Città IndirizzoPrefettura Roma Firenze Tivoli Via Manzoni Chiasso 26 Valori nulli (esempio) …Il valore nullo di Firenze è di tipo 1 in quanto a Firenze esiste sicuramente una Prefettura e quindi in questo caso non si conosce il suo indirizzo. Il valore nullo relativo a Tivoli è di tipo 2 poiché Tivoli non è provincia e quindi non esiste una Prefettura. Infine per Chiasso non si sa nulla (tipo 3) dal momento che si trova in Svizzera e in Svizzera non si sa se ci sono le Prefetture. 27 Valori nulli Come si rappresentano i valori nulli nel modello relazionale? Possibilità 1: usare particolari valori del dominio dell’attributo. Ad esempio: 0, la stringa nulla, etc. Questa possibilità è un po’ rischiosa in quanto si potrebbero utilizzare valori che poi diventano significativi… 28 Valori nulli Come si rappresentano i valori nulli nel modello relazionale? Possibilità 2: si usa un particolare valore denotato con NULL. Di conseguenza, data una ennupla t, si ha che il valore t[A] in corrispondenza dell’attributo A è un valore del dominio di A oppure il valore NULL. 29 Chiavi e valori nulli I valori nulli possono riguardare una chiave o parte di essa? Sì, anche se in presenza di valori nulli non è permesso alla chiave di svolgere correttamente le sue due funzioni di (1) identificare le ennuple della Base di Dati e (2) di determinare i riferimenti con altre relazioni. Quindi la presenza di valori nulli nelle 30 chiavi deve essere limitata! Vincolo di chiave primaria Dalle considerazioni della slide precedente emerge la necessità di definire un vincolo di chiave in cui i valori nulli non siano ammessi. Questo nuovo tipo di vincolo prende il nome di chiave primaria (primary key). Per uno schema di relazione R(X) si possono definire più di un vincolo di chiave e un solo vincolo di chiave primaria Nella Base di Dati della slide successiva, si possono definire due chiavi primarie rispettivamente su Matricola di Studenti e su Codice di Corsi (colonne in rosso). 31 Vincolo di chiave primaria (esempio) Studenti Matricola Cognome Nome DataNascita 276545 Rossi Maria 25/11/1971 485745 Neri Anna 23/04/1972 200768 Verdi Fabio 12/02/1972 587614 Rossi Luca 10/10/1971 Esami MatricolaStudente 276545 276545 200768 Corsi Codice 01 03 04 Voto 28 27 24 Titolo Analisi Chimica Chimica CodiceCorso 01 04 04 Docente Giani Melli Belli 32 Vincolo di integrità referenziale Dati due schemi di relazione R1(X1) e R2(X2), un vincolo di integrità referenziale (chiave esterna o foreign key) di R1 (detta interna) rispetto a R2 (detta esterna o master), impone che un sottoinsieme K1 di X1 sia legato ad un sottoinsieme K2 di X2, definito come chiave primaria per R2. In altre parole, tale vincolo impone che ogni ennupla t1 in R1 abbia valori su K1 che compaiano come chiave primaria in R2. Negli esempi successivi le chiavi esterne sono evidenziate in blu, mentre le chiavi primarie 33 sono evidenziate in rosso. Vincolo di integrità referenziale (esempio1) Studenti Matricola Cognome Nome DataNascita 276545 Rossi Maria 25/11/1971 485745 Neri Anna 23/04/1972 200768 Verdi Fabio 12/02/1972 587614 Rossi Luca 10/10/1971 Esami MatricolaStudente 276545 276545 200768 Corsi Codice 01 03 04 Voto 28 27 24 Titolo Analisi Chimica Chimica CodiceCorso 01 04 04 Docente Giani Melli Belli 34 Vincolo di integrità referenziale (esempio2) Infrazioni Codice Data Vigile Provincia Numero 34321 1/2/95 3987 MI 39548K 53524 4/3/95 3295 TO E39548 64521 5/4/96 3295 PR 839548 73321 5/2/98 9345 PR 839548 Auto Provincia MI TO PR Numero 39548K E39548 839548 Cognome Rossi Rossi Neri Nome Mario Mario Luca Attenzione! Quando si definiscono chiavi esterne che coinvolgono più di un attributo occorre rispettare l’ordine degli attributi. In questo caso infatti (Provincia, Numero) in Infrazioni fa riferimento a (Provincia,Numero) in Auto presi in questo ordine. 35 Vincolo di integrità referenziale (violazione) Cosa succede quando l’aggiunta, la modifica o la cancellazione di una ennupla viola un vincolo di integrità referenziale? Sono possibili tre meccanismi compensativi: rifiuto dell’operazione eliminazione in cascata introduzione di valori nulli 36 Vincolo di integrità referenziale (violazione) Ad esempio nella Base di Dati dell’esempio precedente (Infrazioni e Auto) se si tenta di eliminare da Auto una ennupla a cui è associata un’infrazione in Infrazioni, viene violato il vincolo di integrità referenziale. Le slide successive mostrano il comportamento di due dei meccanismi di compensazione in seguito alla cancellazione della ennupla (TO, E39548, Rossi, Mario) da Auto. 37 Vincolo di integrità referenziale (violazione) Eliminazione in cascata della ennupla (53524, 4/3/95, 3295, TO, E39548) da Infrazioni Infrazioni Codice Data Vigile Provincia Numero 34321 1/2/95 3987 MI 39548K 53524 4/3/95 3295 TO E39548 64521 5/4/96 3295 PR 839548 73321 5/2/98 9345 PR 839548 Auto Provincia MI TO PR Numero 39548K E39548 839548 Cognome Rossi Rossi Neri Nome Mario Mario Luca 38 Vincolo di integrità referenziale (violazione) Introduzione di valori nulli nella ennupla (53524, 4/3/95, 3295, TO, E39548) in Infrazioni Infrazioni Codice Data Vigile Provincia Numero 34321 1/2/95 3987 MI 39548K 53524 4/3/95 3295 NULL NULL 64521 5/4/96 3295 PR 839548 73321 5/2/98 9345 PR 839548 Auto Provincia MI TO PR Numero 39548K E39548 839548 Cognome Rossi Rossi Neri Nome Mario Mario Luca 39