8. Problemi ricorrenti: ordinamento e ricerca Ing. Simona Colucci Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Indice DEE - Politecnico di Bari • Problemi ricorrenti in informatica: – Ordinamento di un vettore: • Ordinamento per selezione: – il metodo di selezione diretta (selection sort) • Ordinamento per scambio: – il metodo dell’affioramento(bubble sort) – Il metodo dell’ordinamento non decrescente(quick sort) • Ordinamento per fusione (merge-sort) – Ricerca in un vettore: • Ricerca sequenziale • Ricerca dicotomica Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Il problema dell’ordinamento • Il problema è quello di ordinare gli elementi di un insieme secondo una prefissata relazione d’ordine, che dipende dalla natura dei dati da ordinare • I metodi di ordinamento si applicano ad – insiemi di dati elementari (singoli numeri o lettere) – dati rappresentati in forma complessa: in generale si fa riferimento ad un insieme di record, dei quali si seleziona un campo che viene usato come campo chiave per l’ordinamento; il risultato dell’ordinamento sarà una ridisposizione dei record secondo l’ordinamento introdotto nel campo considerato. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Metodi di ordinamento Classificazione: • Inserzione: Si considerano gli elementi uno alla volta e ciascun nuovo elemento viene collocato nella posizione che gli compete all’interno dell’insieme di elementi considerati in precedenza. • Selezione: Si scandisce l’insieme in modo da individuare l’elemento più piccolo, che viene separato dal resto dell’insieme. Dell’insieme rimasto viene ancora trovato il più piccolo elemento e lo si colloca di seguito a quello trovato in precedenza. Questo procedimento si itera fino a quando non si sono considerati tutti gli elementi. • Scambio: Si scandisce tutto l’insieme, se due elementi vengono trovati fuori posto si scambiano tra loro. Questo procedimento viene ripetuto fino a quando non si hanno più cambiamenti. • Fusione: Si sfrutta un’operazione più semplice dell’ordinamento, chiamata fusione, che consiste nel formare un insieme ordinato a partire da due insiemi già ordinati Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Prestazioni degli algoritmi • Misurate tramite due fattori: – Numero di confronti necessari per determinare gli elementi fuori posto – Numero di spostamenti da effettuare per riportare gli elementi al loro posto • Algoritmi con valore basso per i due fattori sopra esposti sono più efficienti: eseguono l’ordinamento in meno passaggi, cioè impiegando meno tempo e spazio Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Ipotesi di lavoro DEE - Politecnico di Bari Nel seguito: • come insieme di dati da ordinare considereremo un vettore di numeri interi V di dimensione N; V[i] indicherà l’i-esimo elemento del vettore. • La relazione d’ordine che si prenderà in considerazione è l’usuale ordinamento numerico (basato sui concetti di minore e maggiore) • Supporremo di realizzare un ordinamento crescente. • Con l’istruzione V[i] V[k] abbrevieremo il seguente blocco di istruzioni di scambio: – lavoro = V[i]; – V[i] = V[k]; – V[k]= lavoro; Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per selezione Selection Sort : Il metodo di selezione diretta: • Il metodo fa uso di due indici di posizione : – i: è l’indice dell’elemento del vettore che delimita l’inizio dell’insieme dei valori presi in considerazione ad ogni singolo passo – j: è un cursore che ad ogni passo percorre l’insieme dei valori da scandire – k: è un indice che all’interno di ogni passo tiene traccia del minimo progressivo dell’insieme da scandire Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Ordinamento per selezione DEE - Politecnico di Bari Algoritmo di selezione diretta: • Passo 0: – All’inizio l’indice i viene posizionato sul primo elemento del vettore V; j invece comincia a scandire dal secondo elemento • Passo 1: – Il primo elemento viene confrontato con i rimanenti (scanditi da j), scambiando di posto il primo elemento e quello di valore minimo alla fine della scansione(posizione k) • Passo 2: – Al secondo passo l’indice i viene portato alla seconda posizione, perché il nuovo insieme dei valori da scandire non comprende il primo, che è sicuramente il minimo • Passi successivi: – L’indice j percorre l’insieme dei valori da scandire, a partire dall’elemento successivo a i; il processo riprende in maniera analoga al passo precedente e viene iterato finché l’indice i non giunge all’ultima posizione. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Esempio DEE - Politecnico di Bari 25 8 8 8 8 37 37 25 25 25 41 41 41 27 27 27 27 27 41 37 8 25 37 37 41 • le colonne rappresentano i passi dell’algoritmo • gli elementi evidenziati in azzurro rappresentano il sottoinsieme del vettore da scandire per l’ordinamento ad ogni passo • il cerchio rosso rappresenta l’elemento minimo di ognuno dei sottoinsiemi Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Prestazioni dell’algoritmo • Il metodo di selezione diretta presenta un numero di confronti proporzionale ad N2: – al primo passaggio si effettuano N-1 confronti, al secondo N-2 e così via, fino ad arrivare all’ultimo confronto; si ha pertanto: (N-1) + (N-2) + (N-3) + ….. +1 = N(N-1)/2 • Per quanto riguarda il numero di spostamenti essi sono al più N-1. • La prestazione del metodo per quanto riguarda il numero di confronti non è influenzata dalla configurazione iniziale dei dati(se sono ordinati o meno) Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Selezione diretta: flow-chart DEE - Politecnico di Bari inizio i =0 • Le istruzioni di scambio si trovano nel ciclo scandito dalla i, per cui vengono eseguite N-1 volte AL PIU’ (solo se K!=i) k=i j = i+1 vero •I confronti vengono effettuati N-1 volte per ognuno degli N cicli scanditi dalla i, perché si trovano in un’istruzione di controllo all’interno dei due cicli V[k]>= V[j] k=j falso j++ vero j<N falso k != i vero V[i] falso V[k] i++ vero i<N-1 falso fine Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Codice Sorgente DEE - Politecnico di Bari #include <stdio.h> #define N 10 do{ k=i; j=i+1; do { if(V[j]<= V[k]) k=j; j++ ; } while(j<N); if(k!=i) {temp = V[i]; V[i]=V[k]; V[k]=temp; } i++; }while(i<N-1); void main() {int i, k, j; int V[N]; int temp; for(i=0; i<N; i++) {printf("Inserisci un numero\n"); scanf ("%d", &V[i]); } i=0; for(i=0; i<N; i++) printf("%d\n", V[i]); getch(); } Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Il problema della ricerca • Il problema è quello di cercare un elemento in un vettore • I metodi di ricerca si applicano ad – insiemi di dati elementari (singoli numeri o lettere) – dati rappresentati in forma complessa: in generale si fa riferimento ad un insieme di record, dei quali si cercano uno o più campi che vengono usati come campi chiave per la ricerca. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Metodi di ricerca • Metodi basati sul confronto di chiavi: si confrontano gli elementi del vettore con l’elemento (chiave) che si vuole ricercare: – Ricerca lineare: si confronta ripetutamente la chiave con ciascuno degli elementi del vettore finché eventualmente non si trova la chiave – Ricerca dicotomica: Si confronta la chiave con l’elemento che si trova a metà del vettore (supposto ordinato). Se l’elemento individuato non è uguale a quello cercato si prosegue la ricerca nel semivettore inferiore o superiore a seconda che la chiave sia più piccola o più grande dell’elemento che si trova a metà. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ipotesi di lavoro • Elementi utilizzati nell’analisi: – – – – – Vettore V di dimensione N Chiave di ricerca K Indice i per scorrere il vettore t = indice che punta all’inizio del vettore in cui ricercare u= indice che punta alla fine del vettore in cui ricercare Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Ricerca lineare DEE - Politecnico di Bari • Principio risolutivo: Si confronta ripetutamente la chiave K con ciascuno degli elementi del vettore finché non si trova V(i) = K (ricerca con successo) oppure finché non sono stati considerati tutti gli elementi del vettore senza trovarne nessuno uguale a K (ricerca senza successo). Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Ricerca lineare: flow-chart DEE - Politecnico di Bari start i=0 K ≠ V [i] and i< N no si i = i+1 no si i <N Elemento Non trovato Elemento Trovato con indice i end Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Codice Sorgente DEE - Politecnico di Bari #include <stdio.h> #define N 20 /* definisco la dimensione massima del vettore*/ main() { // La dichiarazione delle variabili int i,K; int V[N]; /* lettura degli elementi del vettore partendo dal primo V[0]*/ while( K != V[i] && i<N ) { // leggere l'elemento successivo dell'array V i = i + 1; } //risultato della ricerca // inserimento del vettore for (i=0;i<N; i++) scanf("%d",&V[i]); // Inserimento del valore da cercare ( la chiave K ) printf("Inserire l'elemento da cercare : "); scanf("%d",&K); if ( i<N ) printf("Elemento trovato in posizione %d\n", i); else printf("Elemento non trovato\n"); } // Fine del main /* la variabile i è stata già usata, è necessario un nuovo assegnamento */ i=0; Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari RICERCA LINEARE: Numero Confronti Due valutazioni diverse a seconda dell’esito della ricerca: • ricerca con successo: si fa riferimento al numero medio di confronti, che si ottiene dividendo il numero totale di confronti necessari per ricercare tutti gli elementi per il numero degli elementi stessi. Siccome per individuare il primo elemento si effettua un confronto, per il secondo due e così via, il numero totale di confronti è : 1+2+3+4+5+….. N = N(N+1)/2 Il numero medio di confronti risulta (N+1)/2 • ricerca senza successo: l’algoritmo esamina sempre tutto il vettore, quindi il numero di confronti è sempre N Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ricerca in vettori ordinati Vantaggio: Il numero di confronti in caso di ricerca senza successo è lo stesso che nella ricerca con successo (N+1)/2, perché si procede alla scansione del vettore finché K ≤ V[i]. A questo punto o K= V[i], e la ricerca è con successo, oppure si possono interrompere i confronti, e la ricerca risulta senza successo. Pertanto si determina il numero medio di confronti come in caso di successo Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari RICERCA BINARIA (detta dicotomica o logaritmica) • • • • • Si applica su vettori ordinati Si confronta la chiave K con l’elemento che si trova a metà del vettore. Se l’elemento individuato non è uguale a quello cercato si prosegue la ricerca nel semivettore inferiore o superiore a seconda che la chiave K sia più piccola o più grande dell’elemento che si trova a metà. Il procedimento continua iterativamente in modo da suddividere le sottotabelle via via individuate. La ricerca termina con successo quando l’elemento V[i] considerato ad un certo passo è proprio uguale a K. La ricerca termina con insuccesso quando la parte di vettore considerata è costituita da un solo elemento. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Ricerca dicotomica: flow-chart DEE - Politecnico di Bari start t=0 u = N-1 i = (t+u)/2 si no no K ≠ V [i] si K > V [i] u=i-1 t=i+1 si t <= u and K ≠ V [i] no no K ≠ V [i] Elemento trovato si Elemento Non trovato end Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ricerca dicotomica: codice (1/2) Versione iterativa //Ricerca dicotomica di una chiave K in un vettore V #include <stdio.h> #define N 10 main() { int i, t, u, K; printf(“Digitare la chiave di ricerca”); scanf(“%d”, &K); i=0; t=0; u=N-1; do { i=(u+t)/2; if (K!=V[i]) { if (K>=V[i]) t=i+1; else u=i-1;} } while((t<=u) && (K!=V[i])); if (K!=V[i]) } else printf("Elemento non trovato nel vettore alla posizione %d", i+1); printf("Elemento trovato nel vettore"); Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ricerca dicotomica: codice (2/2) Versione ricorsiva //Ricerca dicotomica di un brano(key) in un elenco di //titoli(ptot) con estremi t ed u void ricercabin(char key[30], brano ptot[200], int t, int u) { int i; i=(u+t)/2; if ((t<=u) && (strcmp(key, ptot[i].titolo)!= 0)) { if ((strcmp(key, ptot[i].titolo) > 0)) t=i+1; else u=i-1; ricercabin(key, ptot, t, u); } else if ((strcmp(key, ptot[i].titolo)== 0) ) printf("Elemento trovato nel vettore alla posizione %d", i+1); else printf("Elemento non trovato nel vettore"); } Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari RICERCA DICOTOMICA: Numero Confronti • L’algoritmo è il più veloce tra quelli di ricerca basati sul confronto di chiavi. • In un vettore di dimensione N = 2h -1 l’algoritmo deve compiere h=log2(N+1) passi(e quindi confronti) per la ricerca senza successo, mentre i confronti possono essere di meno per la ricerca con successo. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Solo per approfondimento: Ordinamento con algoritmi bubble sort, quicksort e mergesort Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per scambio Il procedimento tipico di qualsiasi algoritmo di scambio è il seguente: • si considerano i primi due elementi dell’insieme; se il primo elemento della coppia è maggiore del secondo i due elementi vengono scambiati di posto tra di loro; • si considera ora una nuova coppia formata dal secondo e dal terzo elemento dell’insieme, si confrontano e si scambiano le posizioni se necessario; • questo procedimento si ripete, considerando coppie di elementi consecutivi, fino a quando non si è esaurito tutto l’insieme Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per scambio Il metodo dell’affioramento (Bubble Sort) • Gli elementi più “pesanti” tendono ad andare verso il basso e quelli più leggeri verso l’alto: – ad ogni passo (step) dell’algoritmo l’elemento in assoluto più pesante sarà collocato nella posizione finale, che al passo successivo non verrà più scandita • Il numero massimo di passi è N-1 , ma dato che ad ogni passo più elementi potrebbero essere “a posto”, i passi potrebbero anche di meno Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Esempio DEE - Politecnico di Bari 25 25 25 25 8 37 37 27 8 25 41 27 8 27 27 27 8 37 41 37 8 41 41 37 41 • le colonne rappresentano i passi dell’algoritmo • gli elementi evidenziati in azzurro rappresentano il sottoinsieme del vettore da scandire per l’ordinamento ad ogni passo • il cerchio rosso rappresenta l’elemento massimo di ognuno dei sottoinsiemi Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Bubble Sort: Flow-chart DEE - Politecnico di Bari inizi o • La variabile più importante usata nel procedimento è: step = 1 j=0 scambi = 0 vero V[j]>V[j+1] V[j] V[j+1] scambi = 1 falso – scambi: viene inizializzata a 0 ad ogni passo e serve per controllare se ci sono stati scambi ad un certo passo: se non ce ne sono il resto di vettore è ordinato j=j+1 vero j < N - step falso step = step + 1 step < N && scambi = 1 vero falso fine Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Codice Sorgente DEE - Politecnico di Bari #include <stdio.h> #define N 10 void main() {int j, step, scambi; int V[N]; int temp; for(j=0; j<N; j++) {printf("Inserisci un numero\n"); scanf ("%d", &V[j]); } step=1 ; do{ scambi=0 ; for(j=0; j< N-step; j++ ) if(V[j+1]< V[j]) {scambi =1; temp = V[j+1]; V[j+1]=V[j]; V[j]=temp; } step++; }while(step<N && scambi !=0); for(j=0; j<N; j++) printf("\n%d", V[j]); getch(); } Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Prestazioni DEE - Politecnico di Bari • Numero di confronti: – l’analisi del caso peggiore porta a concludere che il metodo è di ordine N2 ; il caso peggiore si ha quando l’insieme è ordinato in modo decrescente e da vita ad un numero complessivo di confronti pari a (N-1) + (N-2) + (N-3) + ….. +1 = N(N-1)/2 – Si può dimostrare che questa valutazione è vera anche nella media dei casi – Nel caso in cui in qualche passo vada a posto più di un elemento il numero di confronti complessivi da operare sarà inferiore • Numero di spostamenti: – Si segue un ragionamento analogo (nel caso peggiore sono N(N-1)/2). La prestazione del metodo è pertanto influenzata dalla configurazione iniziale dei dati Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Quicksort • Considerato un elemento a caso, che chiamiamo perno o separatore, si effettua una partizione dell’insieme collocando nella sua giusta posizione il perno e allocando alla sua sinistra tutti gli elementi più piccoli ed alla sua destra tutti gli elementi più grandi del perno stesso • Sui due sottoinsiemi disordinati così individuati si applica ricorsivamente il concetto di partizione Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Quicksort: strategia • Concetto base: • Una sola scansione del vettore è sufficiente per collocare definitivamente un elemento (per esempio il primo) nella sua destinazione finale e allo stesso tempo per lasciare tutti gli elementi con un valore inferiore a quello da una parte, anche se disordinati, e tutti quelli con un valore maggiore, dall'altra • In questo modo, attraverso delle chiamate ricorsive, è possibile elaborare i due segmenti del vettore rimasti da riordinare. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Quicksort: algoritmo approssimato • L'algoritmo può essere descritto grossolanamente come: – localizzazione della collocazione finale del primo valore, separando in questo modo i valori(procedura di partizione); – ordinamento del segmento precedente all'elemento collocato definitivamente; – ordinamento del segmento successivo all'elemento collocato definitivamente. • Variabili impiegate: – – – – LISTA : il vettore da ordinare in modo crescente. A: l'indice inferiore del segmento di vettore da ordinare. Z: l'indice superiore del segmento di vettore da ordinare. CF : sta per «collocazione finale» ed è l'indice che cerca e trova la posizione giusta di LISTA[A] nel vettore. – I: è l'indice che insieme a CF serve a ripartire il vettore. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Procedura di partizione:PART • Sia LISTA il vettore da ordinare • Il primo elemento da collocare corrisponde inizialmente a LISTA[A], e il segmento di vettore su cui intervenire corrisponde a LISTA[A:Z] (cioè a tutti gli elementi che vanno dall'indice A all'indice Z) • Alla fine della prima scansione, l'indice CF rappresenta la posizione in cui occorre spostare il primo elemento, cioè LISTA[A]. In pratica, LISTA[A] e LISTA[CF] vengono scambiati. • Alla fine della prima scansione, gli elementi contenuti in LISTA[A:(CF-1)] devono contenere valori inferiori o uguali a LISTA[CF], mentre quelli contenuti in LISTA[(CF+1):Z] devono contenere valori superiori. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Quicksort: QSORT • Indichiamo con QSORT la procedura che esegue il compito complessivo di ordinare il vettore. Il suo lavoro consisterebbe nel chiamare PART per riordinare gli elementi che vanno dal primo all'ultimo del vettore LISTA restituendo l'indice della collocazione finale, e quindi di richiamare se stessa in modo da riordinare la prima parte e poi la seconda. • Se l'indice Z non è maggiore di A, allora c'è un elemento (o nessuno) all'interno di LISTA[A:Z] e LISTA[A:Z] è già nel suo stato finale. • Se Z è maggiore di A, allora PART ripartisce correttamente LISTA[A:Z]. L'ordinamento separato dei due segmenti completa l'ordinamento di LISTA[A:Z] Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari PART: fasi della scansione • La scansione del vettore da parte di PART avviene portando in avanti l'indice I e portando indietro l'indice CF. Quando l'indice I localizza un elemento che contiene un valore maggiore di LISTA[A], e l'indice CF localizza un elemento che contiene un valore inferiore o uguale a LISTA[A], gli elementi cui questi indici fanno riferimento vengono scambiati, quindi il processo di avvicinamento tra I e CF continua Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari PART: fasi della scansione • Quando la scansione è giunta al termine, quello che resta da fare è scambiare l'elemento LISTA[A] con LISTA[CF] Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari PART: la scansione in pratica • L'indice I, iniziando dal valore A+1, viene spostato verso destra fino a che viene trovato un elemento maggiore di LISTA[A] quindi è l'indice CF a essere spostato verso sinistra, iniziando dalla stessa posizione di Z, fino a che viene incontrato un elemento minore o uguale a LISTA[A]. Questi elementi vengono scambiati e lo spostamento di I e CF riprende • Si prosegue fino a che I e CF si incontrano, e in quel momento LISTA[A:Z] è stata ripartita, e CF rappresenta la collocazione finale per l'elemento LISTA[A] Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari PART: flow-chart Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Quicksort: algoritmo dettagliato • L’algoritmo di quicksort può essere schematicamente definito come: – se A= Z stop – esegui l’algoritmo di partizione su LISTA delimitato da A e Z determinando la posizione CF dell’elemento separatore – Se A < CF esegui quicksort su LISTA delimitato da A, CF-1 – Se CF < Z esegui quicksort su LISTA delimitato da CF+1, Z Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi Codice Sorgente(1/2) DEE - Politecnico di Bari #include <stdio.h> #define N 10 void quicksort( int V[ ], int A, int Z); int part( int V[ ], int A, int Z); main() {int j; int V[N]; void quicksort( int Vett[ ], int A, int Z) {int ris; if (A!=Z) { ris= part(Vett, A, Z); if (ris>A) quicksort(Vett, A, ris-1); if (ris<Z) quicksort(Vett, ris+1, Z); } } for(j=0; j<N; j++) {printf("Inserisci un numero\n"); scanf ("%d", &V[j]); } quicksort(V, 0, N); for(j=0; j<N; j++) printf("\n%d", V[j]); getch();} Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Codice Sorgente(2/2) int part(int LISTA[ ], int A, int Z) {int I, CF; int temp; I=A; CF=Z; while(I<CF) {do{CF--;} while (LISTA[CF]>LISTA[A]); do{I++;} while (LISTA[I]< LISTA[A] && I<CF); if(I<CF) {temp = LISTA[CF]; LISTA[CF]=LISTA[I]; LISTA[I]=temp;} } temp = LISTA[CF]; LISTA[CF]=LISTA[A]; LISTA[A]=temp; return CF; } Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Quicksort: esempio di applicazione LISTA (34 93 64 25 18 29 76 81), di 8 elementi delimitato da A = 1 e Z = 8. 1. siccome A=Z è falso si va in sequenza; 2. si esegue partizione su LISTA delimitato da A=1 e Z=8 trovando la posizione CF = 4 per il separatore 34. 3. poiché A < CF è vero si esegue quicksort su LISTA delimitato da A=1 e Z= 3 3.1 siccome A=Z è falso si va in sequenza; 3.2 si esegue partizione su LISTA delimitato da A=1 e Z=3 trovando la posizione CF = 3 per il separatore 29. 3.3 poiché A < CF è vero si esegue quicksort su LISTA delimitato da A=1 e Z= 2 3.3.1 siccome A=Z è falso si va in sequenza; 3.3.2 si esegue partizione su LISTA delimitato da A=1 e Z=2 trovando la posizione CF=2 per il separatore 25. 3.3.3 poiché A < CF è vero si esegue quicksort su LISTA delimitato da A=1 e Z= 1 3.3.3.1 siccome A=Z è vero si rientra 3.3.4 Poiché CF< Z è falso, si rientra 3.4 Poiché CF< Z è falso, si rientra Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Quicksort: esempio di applicazione 4. poiché CF < Z è vero si esegue quicksort su LISTA delimitato da A=5 e Z= 8 4.1 siccome A=Z è falso si va in sequenza; 4.2 si esegue partizione su LISTA delimitato da A=5 e Z=8 trovando la posizione CF = 5 per il separatore 64. 4.3 poiché A < CF è falso si va in sequenza 4.4 poiché CF < Z è vero si esegue quicksort su LISTA delimitato da A=6 e Z= 8 4.4.1 siccome A=Z è falso si va in sequenza; 4.4.2 si esegue partizione su LISTA delimitato da A=6 e Z=8 trovando la posizione CF=8 per il separatore 93. 4.4.3 poiché A < CF è vero si esegue quicksort su LISTA delimitato da A=6 e Z= 7 4.4.3.1 siccome A=Z è falso si va in sequenza 4.4.3.2 si esegue partizione su LISTA delimitato da A=6 e Z=7 trovando la posizione CF=7 per il separatore 81. 4.4.3.3 poiché A < CF è vero si esegue quicksort su LISTA delimitato da A=6 e Z= 6 4.4.3.3.1 siccome A=Z è vero si rientra 4.4.3.4 poiché CF< Z è falso, si rientra 4.4.4 Poiché CF< Z è falso, si rientra Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari • • Quicksort: prestazioni L’algoritmo di quicksort viene utilizzato quando la disposizione degli elementi è il più possibile casuale; in questo caso il numero medio di confronti risulta in ordine di grandezza inferiore al numero di confronti dei metodi visti in precedenza Data la complessità dell’analisi del quicksort, ci riferiremo solo al caso migliore: il caso in cui la disposizione di dati è tale che ad ogni passo il perno viene collocato alla metà esatta dell’insieme che si considera (es. 85 32 10 71 63 52 21 101 124 152 112 132 149 96 48). – Supponiamo che la dimensione dell’insieme sia: N = 2h-1 • • • – Il numero dei confronti per ogni passaggio risulta proporzionale ad N, perché N sono gli elementi globalmente interessati, mentre il numero di passaggi è h-1. Quindi il numero di confronti è proporzionale a N*(h-1). Tale ordine risulta valido anche nella media dei casi. Il caso peggiore si ha quando il vettore è ordinato, caso in cui il numero di passaggi di partizione è N e il numero di confronti risulta proporzionale ad N2 La prestazione del metodo per il confronto è influenzata dalla configurazione iniziale dei dati; il numero di spostamenti è certamente inferiore al numero di confronti Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per fusione • Sfrutta un problema più semplice dell’ordinamento: quello della fusione: – si parte da due insiemi ordinati, che vengono fusi per generare un unico insieme ordinato – Si acquisisce un elemento dal primo insieme e uno dal secondo, vengono confrontati tra loro e si copia nel vettore di destinazione l’elemento più piccolo; si acquisisce un nuovo elemento dall’insieme dove è stata tolto l’elemento e lo si riconfronta con quello rimasto – Il procedimento ha termine quando sono esaminati tutti gli elementi Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Fusione: algoritmo approssimato • L’algoritmo assume che i due insiemi di partenza, di dimensione N ed M, siano contenuti in un vettore V di dimensione N+M. – Il risultato viene posto in un vettore Z, di dimensione N+M. – L’algoritmo fa uso di tre variabili: • i è un cursore che delimita in V il primo insieme ordinato di partenza 1≤ i≤ N • j è un cursore che delimita in V il secondo insieme ordinato di partenza N+1≤ j≤ N+M • k è un cursore che scorre su tutto il vettore Z 1≤ k≤ N+M Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Fusione: flow-chart Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari • • • • Mergesort binario: algoritmo approssimato Ha come base l’algoritmo di fusione Suddivide gli elementi di V in coppie costituite da elementi consecutivi (primo-secondo, terzo-quarto,..) e ordina tra di loro gli elementi di una stessa coppia; si ottengono così delle coppie ordinate; a questo punto si ordinano tra di loro gli elementi della prima e della seconda coppia, della terza e della quarta, …. ottenendo alla fine delle quadruple ordinate; si ripete fino ad ottenere un unico insieme ordinato. L’algoritmo suppone di partire da un insieme disordinato, di dividerlo in due sezioni e di fondere le due sezioni avendovi prima applicato ricorsivamente l’algoritmo Variabili: – Supponiamo che i due insiemi da ordinare siano allocati nel vettore V in due aree contigue delimitate da u,i la prima e i+1,t la seconda – La variabile i è in sostanza usata per dividere in due l’area di memoria delimitata da u e t – Il risultato della fusione viene sempre collocato nel vettore Z – Alla fine della fusione supponiamo che in V si ricopi l’insieme ordinato. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari – – – – – Mergesort binario: algoritmo dettagliato se u = t allora stop i = (u+t)/2 esegui merge sort su V delimitato da u ed i esegui merge sort su V delimitato da i+1 ed t esegui fusione su V delimitato da u , i e da i+1, t Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Mergesort binario: esempio di applicazione Sistemi Informativi DEE - Politecnico di Bari V ( 34 93 64 25 18 29 76 81 ) N=8 u=1 e t =8 1. 2. 3. siccome u=t è falso si va in sequenza; i←4; esegui sort-merge su V delimitato da u=1 e t = 4; 3.1 siccome u=t è falso si va in sequenza; 3.2 i←2; 3.3 esegui sort-merge su V delimitato da u=1 e t = 2; 3.3.1 siccome u=t è falso si va in sequenza; 3.3.2 i ← 1 ; 3.3.3 esegui sort-merge su V delimitato da u=1 e t = 1; 3.3.3.1 siccome u=t è vero si rientra; 3.3.4 esegui sort-merge su V delimitato da u=2 e t = 2; 3.3.4.1 siccome u = t è vero si rientra; 3.3.5 esegui fusione su V delimitato da u=1 i=1; i+1=2 t=2 3.4 esegui sort-merge su V delimitato da u=3 e t = 4; 3.4.1 siccome u=t è falso si va in sequenza; 3.4.2 i ← 3 ; 3.4.3 esegui sort-merge su V delimitato da u=3 e t = 3; 3.4.3.1 siccome u=t è vero si rientra; 3.4.4 esegui sort-merge su V delimitato da u=4 e t = 4; 3.4.4.1 siccome u = t è vero si rientra; 3.4.5 esegui fusione su V delimitato da u=1 i=2; i+1=3 t=4 3.5 esegui fusione su V delimitato da u=1 i=2; i+1=3 t=4 Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari Mergesort binario: esempio di applicazione 4. esegui sort-merge su V delimitato da u=5 e t = 8; 4.1 siccome u=t è falso si va in sequenza; 4.2 i←6; 4.3 esegui sort-merge su V delimitato da u=5 e t = 6; 4.3.1 siccome u=t è falso si va in sequenza; 4.3.2 i ← 5 ; 4.3.3 esegui sort-merge su V delimitato da u=5 e t = 5; 4.3.3.1 siccome u=t è vero si rientra; 4.3.4 esegui sort-merge su V delimitato da u=6 e t = 6; 4.3.4.1 siccome u = t è vero si rientra; 4.3.5 esegui fusione su V delimitato da u=5 i=5; i+1=6 t=6 4.4 esegui sort-merge su V delimitato da u=7 e t = 8; 4.4.1 siccome u=t è falso si va in sequenza; 4.4.2 i ← 7 ; 4.4.3 esegui sort-merge su V delimitato da u=7 e t = 7; 4.4.3.1 siccome u=t è vero si rientra; 4.4.4 esegui sort-merge su V delimitato da u=8 e t = 8; 4.4.4.1 siccome u = t è vero si rientra; 4.4.5 esegui fusione su V delimitato da u=7 i=7; i+1=8 t=8 4.5 esegui fusione su V delimitato da u=5 i=6; i+1=7 t=8 5. esegui fusione su V delimitato da u=1 i=4; i+1=5 t=8 Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011 Sistemi Informativi DEE - Politecnico di Bari • • • • • • • Mergesort binario: prestazioni L’algoritmo di merge-sort è particolarmente vantaggioso perché il numero di confronti è lo stesso in tutti i casi, anche quello peggiore. Il metodo opera partizioni dell’insieme di partenza che sono ad ogni passo della stessa dimensione. Supponiamo che la dimensione dell’insieme sia: N= 2h Il numero dei confronti per ogni passaggio risulta N, perché N sono gli elementi globalmente interessati, mentre il numero di passaggi è h = log2 N. Quindi il numero di confronti è proporzionale a N*(h) = N * log2 N. Al primo passaggio abbiamo N/2 coppie di dimensione N/N/2 =2 su cui applicare l’algoritmo di fusione (per il quale nel caso peggiore si hanno un numero di confronti pari alla grandezza della coppia). Il numero di confronti al primo passo è pertanto (N/2) * 2= N. Al secondo passaggio abbiamo N/4 vettori di dimensione N/N/4 =4 su cui applicare l’algoritmo di fusione (per il quale nel caso peggiore si hanno un numero di confronti pari alla grandezza della coppia). Il numero di confronti al secondo passo è pertanto (N/4) * 4 = N. Procedendo è facile comprendere che il numero dei confronti risulta N ad ogni passaggio. Fondamenti di Informatica CDL in Ingegneria Gestionale(B) - A.A. 2010-2011