Problema 1: Vengono messi in prova simultanea 30 componenti, supponendo che abbiano vita esponenziale i.i.d.; il test viene interrotto quando si verifica l'ottavo guasto. I tempi di fallimento, in ore, sono i seguenti: 0.35 0.73 0.99 1.40 1.45 1.83 2.20 2.72 (1) Calcolare un intervallo di confidenza bilaterale al 5% di significatività per il tempo di vita medio; (2) Tracciare il grafico delle probabilità di sopravvivenza vs. tempo, secondo il metodo di KaplanMeier. Anni ’30: primi concetti di Teoria dell’Affidabilità (industria aeronautica) Secondo Dopoguerra: si crea un insieme organico di concetti basati sulla definizione di affidabilità in termini probabilistici Oggi: ampliamento della disciplina grazie a numerose tecniche basate su strumenti matematici e ingegneristici, con possibilità di applicazione in svariati campi Un prodotto si considera di alta qualità se risulta conforme alle sue norme di funzionamento e incontra le esigenze del consumatore Un sistema si dice affidabile se continua a funzionare secondo le esigenze specifiche per un periodo sufficientemente lungo Lunghezza dell’intervallo di tempo X dall’attivazione di un componente (al tempo t = 0) fino al suo guasto La rottura di un sistema o di un suo particolare componente è di natura completamente casuale, dunque X è modellizzato da una variabile aleatoria continua che assume valori non negativi Indichiamo con FX t la sua funzione di ripartizione e con f X t la sua densità di probabilità La funzione di affidabilità (o reliability function) di un componente è definita come la probabilità che quest’ultimo sia ancora funzionante al tempo t, vale a dire: R X (t ) P X t E’ determinata univocamente dalla funzione F t , infatti per le proprietà di funzione di distribuzione: R X (t ) P X t 1 P X t 1 F t t0 E’ la funzione definita da: f t f t t : Rt 1 F t t0 Determina univocamente la funzione di distribuzione della variabile aleatoria X : FX t 1 exp s ds t 0 FF f t dt P X t , t dt t dt : 1 F t 1 F t P X t , t dt P X t , t dt , X t P X t P X t P X t , t dt | X t Dunque la quantità t rappresenta la densità di probabilità che se il sistema è ancora attivo all’istante t, esso si guasti nell’immediato futuro, cioè nell’intervallo (t,t+dt) Proprietà di “assenza di memoria”: P X t s, X t P X t s P X t s | X t P X t P X t e t s s P X s e t e cioè la distribuzione della vita residua di un oggetto avente età t è perfettamente identica a quella di un oggetto nuovo Di conseguenza l’intensità di rottura deve essere una funzione costante nel tempo, come è verificato nei seguenti passaggi: s e ds 1 e t F t 0 t t f t e t : t 1 F t e Se si vogliono effettuare test per la stima del tempo medio di vita in un campione, ci si può trovare di fronte a 3 diversi schemi di prova: 1. Prove simultanee e interruzione al fallimento r-esimo; 2. Prove sequenziali; 3. Test simultaneo con interruzione ad un tempo fissato. In ognuno di questi casi si trova, mediante alcuni passaggi, che lo stimatore di massima verosimiglianza del tempo medio di vita è dato da: r ̂ : X n r X i 1 i r r : r dove è il cosiddetto Total Time on Test (statistica del tempo totale di funzionamento) e r è il numero totale di guasti che si sono verificati durante l’esperimento. Alla luce di alcune considerazioni, osserviamo che , essendo la somma di r variabili esponenziali i.i.d., di media , ha distribuzione gamma di parametri r e 1 . Ricordando le seguenti implicazioni: 2 ~ 1 2 r , ~ r , 1 2 ricaviamo che 2 2 2 P 1 ,2r 1 , 2 r 2 2 ~ 2r2 Quantili chi-quadrato Quindi vi è un livello di confidenza 1 nell’affermare che: 2 2 , 2 2 1 , 2 r ,2r 2 2 Data la funzione di intensità di rottura: t t 1 t 0 con e costanti positive arbitrarie, la distribuzione di X che corrisponde a una tale scelta di t prende il nome di distribuzione di Weibull di parametri e ( X ~ W , ). Risulta essere una generalizzazione della distribuzione esponenziale I dati relativi ai tempi di sopravvivenza tengono conto anche delle osservazioni censurate, cioè quelle osservazioni che sono “sopravvissute” fino ad un certo istante e poi sono state rimosse dall’indagine Le tecniche di Analisi della Sopravvivenza possono adattare tali osservazioni e usarle in test statistici di significatività e nella stima di modelli Per stabilire la qualità di un determinato prodotto è fondamentale l’affidabilità garantita dal prodotto stesso Obiettivo: quantificare questa attendibilità, per ricavare stime del tempo di vita utile del prodotto Negli ultimi decenni si sono sviluppate molte tecniche specializzate in questo senso, con lo scopo di determinare in modo significativo la “probabilità di vita” di un oggetto Proposto per la prima volta nel 1958, permette una stima della funzione di sopravvivenza Il metodo consiste nell’ordinare in modo crescente i tempi di sopravvivenza t1 , t 2 ,..., t n rilevati; in corrispondenza ad ogni “evento” i si trova il numero di soggetti ( ni ) ancora in vita immediatamente prima dell’evento e il numero di fallimenti d i . La stima per i tempi t i è data dalla formula ricorrente: ni d i S ti S ti 1 ni In un tempo precedente al primo evento tutti i soggetti sono in vita, dunque denotando con t0 l’inizio dell’esperimento si ha che S t0 1 Per le osservazioni censurate d i 0 La curva di sopravvivenza non viene modificata al tempo esatto di un’osservazione censurata, ma all’evento immediatamente successivo a tale osservazione, quando il numero di soggetti a rischio viene ridotto Problema 1: Vengono messi in prova simultanea 30 componenti, supponendo che abbiano vita esponenziale i.i.d.; il test viene interrotto quando si verifica l'ottavo guasto. I tempi di fallimento, in ore, sono i seguenti: 0.35 0.73 0.99 1.40 1.45 1.83 2.20 2.72 (1) Calcolare un intervallo di confidenza bilaterale al 5% di significatività per il tempo di vita medio; (2) Tracciare il grafico delle probabilità di sopravvivenza vs. tempo, secondo il metodo di KaplanMeier. Comandi principali: > T <- (sum(z[1:8])+(n-r)*z[8]) In tal modo si determina il Total Time on Test, indicando con: z il vettore contenente i 30 dati dell’esperimento n il numero totale di tempi registrati [in questo caso 30] r il numero di fallimenti [in questo caso 8] Comandi principali: > alfa <- c(0.05) Fissato il livello di significatività pari al 5%, calcoliamo i valori delle due statistiche chi-quadro di cui abbiamo bisogno per costruire l’ intervallo di confidenza: > v <- qchisq((alfa/2),(2*r)) > w <- qchisq((1-alfa/2),(2*r)) Comandi principali: > a <- ((2*T)/w) > b <- ((2*T)/v) Definisco così gli estremi. Per avere conferma del fatto che l’intervallo trovato sia ragionevole [in questo caso (4.96,20.70)], calcoliamo lo stimatore di massima verosimiglianza e controlliamo che sia contenuto in esso: > theta1 <- T/r Il valore calcolato [8.94] ricade nell’intervallo. Comandi principali: > test1 <- list(time= c(z), status= c(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0)) > Surv(test1$time, test1$status) [1] 0.35 0.73 0.99 1.40 1.45 1.83 2.20 2.72 2.72+ 2.72+ 2.72+ 2.72+ [13] 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ [25] 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ Comandi principali: > fit <- survfit(Surv(time, status), data=test1) > plot(fit, main="Curva di sopravvivenza (Kaplan-Meier)") Questi comandi ci permettono di costruire la curva di sopravvivenza con il metodo di Kaplan-Meier. Bibliografia [1] Sheldon M. Ross (2003), Probabilità e Statistica per l’Ingegneria e le Scienze, Apogeo. [2] B.V. Gnedenko, K. Belyayev, A.D. Solovyev (1969), Mathematical Methods of Reliability Theory, Academic Press. [3] Nozioni tratte dal sito Electronic Textbook StatSoft, “www.statsoft.com/textbook.html”.