Sergio Di Veroli ([email protected]) TECNICHE AFFIDABILISTICHE PER IL PIANO DELLA MANUTENZIONE 1. Applicabilità delle tecniche RCM (Reliability Centered Maintenance) Le metodologie indicate in questo articolo si possono applicare a progetti di ingegneria di qualsiasi natura. Dalle costruzioni, a tutti i tipi di impianti e produzioni industriali, nonché al mondo dei trasporti aerei e ferroviari, tali metodologie vengono oggi applicate per minimizzare il Costo del Ciclo di Vita (LCC) di prodotti/impianti e ottenere la massima sicurezza per chi costruisce e la massima produttività/investimento per chi deve operare. La manutenzione intelligente è basata su modellazioni di analisi predittiva dell’affidabilità che possono raggiungere oggi un grado elevato di previsione della frequenza dei guasti nel tempo di un prodotto/sistema anche quando il sistema è ormai nelle mani di un cliente/utente. Tale possibilità permette oggi di poter calcolare il costo degli eventuali guasti dal campo, a condizioni soddisfatte di manutenzione programmata da fare in tempi certi, così da poter prevedere il costo medio statistico delle garanzie date al cliente per un tempo determinato e potere includere tali costi nel prezzo iniziale pagato. Analogamente, nel campo della sicurezza, le sofisticate analisi FMEA/FMECA sulle modalità e gli effetti dei guasti e della loro criticità (binomio gravità-frequenza della modalità di guasto) ci aiutano a dare priorità alle operazioni di manutenzione e a minimizzare gli incidenti possibili. Il trattamento che segue, sommario perché limitato nella lunghezza, non tratterà in modo esplicito il tema del calcolo affidabilistico delle parti, né affronterà quello dell’elenco delle modalità causa-effetto dei guasti in senso funzionale, ma le userà, come già presenti da progetto, nella metodologia del calcolo del piano di manutenzione ottimale. © Copyright 1/12 E’ ormai una necessità soffermarsi sul comportamento delle apparecchiature elettroniche, insieme a quelle meccaniche e elettromeccaniche perché la presenza dell’elettronica è talmente dilagante in tutte le apparecchiature di impianto che dal suo comportamento non si può più prescindere. 2. Scelta della tecnica più appropriata Si usano sostanzialmente due tecniche distinte basate sull'affidabilità per la ottimizzazione del piano di manutenzione e dei suoi i costi. La prima WEIBULL (Generale) modalità RCM (Reliability Centered Z(t) =2 Maintenance) riguarda tutti i tipi di componenti /apparati =4 che si possono trattare, dal punto di vista del loro com- t portamento affidabilistico, in POISSON ( base alla curva di Poisson, Z(t) ossia a un comportamento di densità dei guasti sostan- Vita utile Infanzia =1 Fig. 1 Rischio di guasto nel tempo delle varie tipologie di componenti t zialmente costante nel tempo. Rispondono a questo tipo di comportamento i componenti di tipo elettronico o elettrico quando non interviene la meccanica. Oggi in molti casi può essere usato lo stesso modello per tutti i componenti anche meccanici che non risentono in modo significativo del consumo come ad esempio possono essere i cuscinetti in Teflon o in Composito. In generale le apparecchiature elettroniche hanno il vantaggio di poter usare molto più precisamente e in maniera estensiva le modalità di rivelazione del guasto (Testability) così da ridurre i tempi di individuazione della parte guasta. Inoltre il ricorso a reti con parti duplicate in stand-by è relativamente più semplice che nelle apparecchiature meccaniche dove il fattore spazio è spesso prevalente. 2/12 © Copyright La seconda tecnica RCM serve a determinare il piano ottimale di manutenzione programmata nei casi in cui esiste, in modo parziale o totale, un consumo delle parti che può essere previsto, su base affidabilistica, in proporzione all’uso dell’impianto e/o sistema, da sottoporre a manutenzione; ossia, in termini matematici, quando l’andamento della densità di guasto, di una parte o del tutto, segue la funzione di Weibull. Questo è il caso delle apparecchiature meccaniche o elettromeccaniche e quindi anche della grande maggioranza degli impianti di edificio più evidenti, come quelli idraulici, di climatizzazione, di Safety antincendio come quelli a splinker e delle macchine di produzione industriale da cui dipendono le reali capacità produttiva delle linee. Questi andamenti permettono di prevedere, se opportunamente visualizzati, i livelli di consumo delle parti e quindi stabilire il limite del cambio della parte al margine dell’avvento di un rischio il cui livello non è opportuno superare (Fig. 1). Pertanto un eventuale consumo anomalo non può sorprenderci perché siamo in tempo a prendere le decisioni di correzione dell’anomalia della parte, prima che essa avvenga e produca danni o pericoli anche se questa anomalia avviene in periodo antecedente al tempo della prevista manutenzione programmata. I sistemi FRACAS (Failure Report Analysis and Corrective Action System) possono misurare lo MTBUR (Mean Time Before Unscheduled Removal) che è il metro della bontà del piano di manutenzione a programma e dei suoi ritmi di sostituzione delle parti. Ciò può portare, al minimo, alla correzione del ritmo temporale della manutenzione a programma e, al massimo, alla revisione del progetto e alla emissione degli Alarm bullettin che richiedono di cambiare obbligatoriamente qualcosa in tutto il parco macchine dei clienti. 3. Il modello RCM nei componenti che seguono la curva di Poisson In questo caso dove, in genere, non c’è premonizione dell’avvento di una anomalia, la manutenzione non può che essere di tipo correttiva, ossia dove si può operare solo dopo l’avvenuto guasto. Ma come si fa a evitare che il sistema possa creare dei danni irreversibili per un guasto imprevedibile? © Copyright 3/12 Si deve innanzitutto progettare il sistema affinché abbia le giuste ridondanze e/o parallelismi (Fig.3) per evitare che, in caso di guasto o anomalia improvvisa di un componente essenziale, il sistema e il servizio vengano a mancare soprattutto se la loro sussistenza può produrre riduzioni della Sicurezza umana. Questo è per esempio il progetto che si adotta nelle cabine elettriche MT/BT di alimentazione dei grandi impianti industriali, dove in genere si mette un modello di tipo 2 su 3 per i trasformatori, ossia con riserva di una unità a scambio manuale. Oggi i produttori più avanzati offrono componenti studiati apposta per avere una curva della densità delle anomalie (gaussiana) nel tempo oltre che pressoché statisticamente ripetitiva in tutti i componenti dello stesso tipo anche con curva molto stretta intorno al valore medio. Tali sono per esempio certi tipi di lampade a gas con accensione elettronica che denunciano un fine vita tra le 10.000 e le 12.000 ore di uso. Questo dato permette di adottare un piano di manutenzione economico e rapido che può sostituire tutte le lampade con la stessa vecchiaia prima dell’avvento del periodo di altissimo rischio. TEMPO DÌ RIPRISTINO RITARDO GUASTO TEMPO DI MANUTENZIONE CORRETTIVA RITARDO TECNICO LOCALIZZ. CORREZZ. LOGI STICO RIPRISTINO COLLAUDO TEMPO DÌ RIPARAZIONE MCT = MEAN CORRECTIVE TIME (TEMPO MEDIO MANUTENZIONE CORRETTIVA) MRT = MEAN REPAIR TIME (TEMPO MEDIO PER LA RIPARAZI ONE) MTTR =MEAN TIME TO RESTORATION (TEMPO MEDIO DÌ RIPRISTINO) A MTBF MTBF MTTR Fig. 2 (DISPONIBILITA’) Per i casi più comuni di sistemi ridondati, occorre fare un discorso molto rigoroso sul tempo di correzione del guasto. Infatti tanto più è breve questo tempo più è affidabile il sistema ridondato. In questi casi si ricorre allo studio delle reti RBD (Reliability Block Diagram) e alla determinazione del MTBCF (Mean Time Between Critical Failures), ossia il tempo medio di Disponibilità del servizio anche quando alcuni componenti sono in riparazione o sostituzione. Nella fig.4 la curva è quella della Disponibilità nel tempo e lo MTBCF calcolato per la rete di fig.3. In questa figura compare anche sopra l’albero del sistema con i suoi dati affidabilistici e di manutenibilità. Determinante è lo MCT (Mean 4/12 © Copyright Corrective Time)(tempo di riparazione) che rappresenta, in un sistema ridondato, il tempo in cui il sistema può sopravvivere in servizio. E’ chiaro che la probabilità che un guasto sopraggiunga nel periodo in cui è assente per guasto la riserva, aumenta con il tempo di uso del sistema, anche se i componenti seguono la curva di Poisson, perché i componenti comunque hanno o stanno per superare lo MTBF della singola parte. I parametri importanti da prendere in considerazione per determinare lo MCT sono: Il tempo riparatore di sul arrivo del posto di riparazione dopo il riscontro della Anomalia, ossia la disposizione logistica e l’organizzazione dei posti di manutenzione intermedi in cui risiedono i manutentori. Fig. 3 La facilità nella individuazione della parte guasta. Per ridurre questo tempo occorre aver fatto una giusta FMECA/TA analisi (Testability Analysis) e della Logistica per basarsi nel progetto sul tempo medio che ci vuole Fig. 4 per realizzare la ripa- razione. Se le cause di guasto e gli effetti (analisi FMEA) vengono riportati per iscritto su un libro, ciò aiuta l’operatore a trovare in breve tempo la causa del guasto, oppure serve a dotare il sistema con opportuni rivelatori a led delle singole cause di guasto o della perdita di una funzione delle macchine nel sistema. © Copyright 5/12 E’ importante studiare la logistica delle parti di scorta che abbiano sempre un numero adeguato di parti nei magazzini, in modo che ci siano adeguate parti nei magazzini collocati al giusto luogo (ILS) Integrated Logistics Support. Se è vero che non sappiamo quando un componente si guasterà, è pure vero che conosciamo la guastabilità media delle parti e quindi, con metodi matematici di calcolo che tengano conto oltre che dell’affidabilità anche della posizione dei magazzini rispetto alle parti da riparare, dovremmo essere capaci di metterci al riparo dal trovarci senza parti di scorta al momento opportuno. Da respingere assolutamente è l’assegnazione delle parti di scorta a percentuale fissa del parco macchine consegnato al cliente. Si rischia di avere abbondanza di parti assolutamente affidabili e mancanza della parte giusta al momento giusto. Ad esempio nella impiantistica di edificio industriale o no, occorrerebbe mettere nei calcoli delle parti di scorta l’insieme delle apparecchiature elettroniche di controllo e di accensione delle lampade fluorescenti, la parte elettronica dei sensori antifumo, per non parlare dell’elettronica presente nelle cabine MT/BT ecc. E’ molto importante che le anomalie che si possono verificare riguardanti la diminuzione o perdita della sicurezza (Safety) vengano riportati mediante un sistema di supervisione allarmi a un centro di controllo sorvegliato 24/24 ore o comunque trasmessi in modo sicuro tramite telefoni cellulari ad addetti che possano intervenire in caso di necessità. In questo caso il valore della TA viene moltiplicato, in quanto si produce non solo un migliore controllo in termini di Safety, ma anche una riduzione dei costi di manutenzione nel senso della riduzione del tempo tecnico di intervento, in quanto, già a distanza, si può comprendere quale sia la parte guasta e reperirla in magazzino prima dello spostamento del personale addetto. In pratica invece di 4 spostamenti se ne fanno solo 2. La reperibilità delle parti di scorta nella misura giusta può evitare grandi pericoli. Per esempio, nel caso dei sensori antifumo essi non possono essere raddoppiati in ogni zona e quindi una loro prolungata mancanza può creare grandi pericoli per la prevenzione incendi soprattutto in sale affollate come cinema o auditorium, oppure in magazzini pieni di materiali facilmente incendiabili che possono provocare danni ingenti a entità, persone o cose. 6/12 © Copyright A differenza dei componenti meccanici e elettromeccanici, i componenti elettronici sono molto sensibili alle condizioni ambientali in cui vivono. Per questo esistono delle simulazioni (modelli) che misurano il comportamento di tali componenti secondo l’ambiente come per esempio di tipo GF (fisso in temperatura ambiente, anche all’aperto), GB (fisso in ambiente controllato come umidità e temperatura), GM (a terra ma su mezzo mobile) ecc.; ne consegue che quando si istallano le apparecchiature occorre fare molta attenzione a porle negli ambienti per i quali sono state studiate ed evitare di cambiarne l’ambiente durante l’operatività degli impianti, perché se ne varia il modello affidabilistico. A questo proposito, è da dedicare particolare attenzione alle apparecchiature miste elettronico-meccaniche, ossia quasi tutte quelle di oggi, dove si può sbagliare facilmente a mettere tali apparecchiature in ambienti umidi, non opportunamente climatizzati, con conseguenza di abbassare lo MTBF della parte elettronica. 4. Un approccio sistematico alla costruzione del Piano di manutenzione per componenti/sistemi che rispondono a Curve di Weibull o miste con Poisson Nel caso in cui dobbiamo trattare di apparecchiature con componenti che rispondono a curve di Weibull o miste con componenti che rispondono a curve di Poisson, il piano di manutenzione va fatto oltre che per il consumo, anche per dare una gradazione di pericolosità ai vari eventi di guasto che si possono manifestare. Ci sono dei casi in cui l'affidabilità di un componente può nasconderci la sua pericolosità nel caso di guasto. Quindi bisogna fare un ragionamento complesso sulla probabilità di guasto e sull'effetto che tale guasto può produrre. È chiaro che sui componenti di tipo meccanico o elettromeccanico la frequenza di uso può cambiare completamente il piano di manutenzione. Facciamo l'esempio più semplice, che è quello dei sensori antifumo: ci può essere una notevole differenza di tempo di manutenzione di pulizia a secondo della posizione di tali sensori in un edificio. Se li mettiamo nella sala dei fumatori, supponendo che non abbiano la sensibilità sufficiente per essere attivati di volta in volta dal fumo del fumatore, essi sicuramente si opacizzeranno molto prima di quelli messi in altri posti dell'edificio. Richiedono perciò, per mantenere la loro funzione, un piano di manutenzione di ritmo più veloce nella frequenza, rispetto a quello standard. Essendo il © Copyright 7/12 rivelatore di fumo l'elemento di eccellenza della sicurezza antincendio, non possiamo trascurarlo nella normale manutenzione, anche quando sono mutate le condizioni di uso, a pena di elevato rischio. Naturalmente il ragionamento può essere esteso ai reparti verniciatura. L’esempio più eclatante di uso contemporaneo delle tecniche di previsione del comportamento di tipo Weibull e della Testability, è quello della ferrovia TAV tra Bologna e Milano dove il ponte sul fiume Pò viene monitorato continuamente mediante la presenza di 100 sensori messi nella struttura per misurarne le tensioni. Queste misure riportate a un centro di controllo permettono di accorgersi in tempo di eventuali anomalie. Per dare una sensazione importante del vantaggio di usare le tecniche RCM, il costo di questo sistema di controllo è stato meno dell’1% del costo della costruzione del ponte, con beneficio incommensurabile sulla Safety e notevole sul LCC. La metodologia RCM utilizza un approccio sistematico per capire come un apparato/macchina si guasta e quali obiettivi di manutenzione occorra porsi per minimizzare guasti e massimizzare l'affidabilità. Questa metodologia ci indirizza anche a comprendere perché certe attività di manutenzione devono essere fatte e darsi invece una giustificazione per eliminare o rarefare alcune manutenzioni preventive non necessarie. Questo sistema permette di arrivare al mix ottimale tra la manutenzione correttiva, la preventiva, e la manutenzione basata “On condition”. La RCM è un approccio che considera l’importanza della missione, dell'ambiente, della “safety” e della “security”. La metodologia RCM che si usa normalmente è formata da una successione di cinque step. Questi step possono essere anche sviluppati con opportuni programmi software che aiutano nel definire il piano di manutenzione preventiva. a) Identificazione delle funzioni significative b) Analisi FMEA/FMECA e divisione per categorie degli effetti di guasto c) Strategia della manutenzione preventiva e decisioni conseguenti d) Definizioni della manutenzione preventiva e ottimizzazione della frequenza e) Generazione del rapporto RCM 8/12 © Copyright RCM- logica per la determinazione della rilevanza della funzione Ha la perdita di questa funzione un effetto contrario alla sicurezza e/o all’ambiente ? yes No Ha la perdita di questa funzione un effetto contrario alle normali operazioni? yes No Ha la perdita di questa finzione un effetto di aggravio economico ? yes Fig. 5 Analisi FMECA e categorizzazione degli effetti di guasto. No E’ questa funzione protetta in un già esistente piano di manutenzione? yes No FUNZIONE NON SIGNIFICATIVA FUNZIONE SIGNIFICATIVA Identificare tutti i guasti funzionali e fare le analisi FMECA e RCM Percorrere la logica delle decisioni e fare il doppio click su una di queste opzioni. Le tre figure 5,6,7 rappresentano alcuni passi della logica con la quale si può costruire un piano di manutenzione. RCM: la priorità delle failures e conseguenze logiche. Il guasto funzionale si evidenzia da se all'operatore mentre sta svolgendo i suoi normali compiti? Evidente Nascosto sì no La modalità di guasto causa la perdita della funzione o provoca, come effetto secondario, un danno che potrebbe portare a un effetto negativo sulla sicurezza operativa o potrebbe portare a seri danni all'ambiente? Si No Effetto evidente sull' economia/ operatività. Effetto evidente sulla sicurezza/ ambiente. Fig. 6 Decisioni strategiche per la manutenzione preventiva. Può l'arrivo della modalità di guasto nascosta in combinazione con un diverso guasto/evento causare una perdita di funzione o un danno secondario che avrebbe un effetto contrario alla normale operatività o creare serie violazioni alla sicurezza ambientale? No Effetto nascosto sulla sicurezza/ ambiente. Si Effetto nascosto sull' economia/ operatività. Si percorra la logica delle decisioni e si faccia il doppio click su una di queste opzioni. © Copyright 9/12 Decisioni sulla Manutenzione Preventiva La criticità della modalità di guasto è accettabile ? Si Procedure di manutenzione correttiva,senza piano della manutenzione preventiva (PM). Si Procedure di controllo di condizioni previste. Si Procedure previste di riparazione o rottamazione. Si Procedure previste per trovare la failure. Si C'è una combinazione di procedure tecnicamente fattibili e con quali mezzi ? No C’è un’operazione per determinare se sta’ avvenendo un guasto e se dovesse accadere sarebbe tecnicamente affrontabile? Qual è l'impegno per farlo? No Sono tecnicamente fattibili procedure di riparazione o di rottamazione per ridurre la frequenza dei guasti ? Qual è l'impegno per farlo? No E’ tecnicamente fattibile un metodo per trovare la failure tramite la rivelazione di essa, e con quali mezzi? No La criticità della modalità di guasto è alta o estremamente alta? No Fig. 7 Si Niente manutenzione a programma. Combinazione di procedure. No Rivisitazione della struttura della parte. Definizione delle operazioni della manutenzione preventiva e ottimizzazione della frequenza. Si percorra la logica delle decisioni e si faccia il doppio click su una di queste opzioni 5. Nota finale Già oggi si possono annoverare costruzioni, impianti industriali e mezzi di trasporto che vengono mantenuti in base alle regole e calcoli RCM. E’ probabile che fra non molto si richiederà a tutti i progettisti di dimostrare che abbiano seguito le opportune procedure per un progetto della manutenzione che assicuri oltre la massima disponibilità operativa, un rispetto assoluto della sicurezza. Lo scritto sommario che vi abbiamo presentato speriamo che possa essere uno stimolo, per gli ingegneri di progettazione e per quelli della manutenzione ad adeguarsi culturalmente all’uso pratico delle metodologie RCM oggi sempre più necessarie per progettare e gestire costruzioni e prodotti di grande qualità con costi che permettono la competitività a livello nazionale e internazionale. 10/12 © Copyright Particolare importanza assumono le tecniche sopraddette nel caso di contratti di gestione in concessione o di project financing, dove il controllo dei costi su un largo intervallo pluriennale, può essere determinante sulla riuscita positiva di un business. L’adozione o meno di tali tecniche è, tante volte, più di cultura da usare nel progetto e nella operatività, che per i reali costi che comportano, messi di fronte ai benefit incommensurabili in termini di Safety e Produttività che essi generano. Tra l’altro la conoscenza e l’uso di tali tecniche permette di essere molto più accurati nelle richieste di specifica tecnica nella fornitura di parti e apparati provenienti da Terzi esterni, necessarie per realizzare sistemi produttivi di alta efficienza. 6. Glossario FMEA,FMECA- Failure Mode Effects and (Criticality) Analysis FRACAS- Failure Report Analysis & Corrective Action System FTA- Fault Tree Analysis ILS- Integrated Logistics Support MTBF- Mean Time Between Failures MTBUR- Mean Time Before Unscheduled Removal MARKOV- Reti di Markov per l’analisi delle prestazioni e evoluzioni dei sistemi fisici. MCT- Mean Corrective Time MTTR- Mean Time To Restoration MTR- Mean Time for Repair RAM – Reliability, Availability, Maintainability, RBD - Reliability Block Diagram RCM- Reliability Centered Maintenance TA- Testability Analysis 7. Bibliografia essenziale Blanchard, Benjamin S. Maintainability A Key to Effective Serviceability and Maintenance Management- John Wiley & Sons, Inc. New York, NY. 1994. Furlanetto Luciano (a cura di): Manuale di Manutenzione degli Impianti e Servizi. Franco Angeli, 2008. Manuale d’uso della tecnica MMEL nel sistema RAMC della Advanced Logistics Developments (www.ald.co.il). Manuali: MIL HDBK 472 procedure 5 & MIL STD 721. Moubray, John. Reliability-Centered Maintenance. Industrial Press. New York, NY. 1997. Standard SAE ARP 4761- SAE JA1011. © Copyright 11/12 Breve biografia dell’autore Sergio Di Veroli, ingegnere elettronico laureatosi alla Sapienza di Roma e specializzatosi al Politecnico di Milano, è attualmente direttore della Società Telebit, attiva da 20 anni in Italia nel campo della Qualità/Affidabilità e dei sistemi di Manutenzione. In precedenza è stato dirigente in grandi aziende del campo dei sistemi di telecontrollo/telecomunicazioni, in particolare per molti anni nella Società Telettra. Per questa Società ha tra l’altro partecipato al progetto e alla costruzione dei Sistemi di Dispacciamento Nazionale dell’ENEL e dell’Ente Elettrico Turco (TEK). E’ stato anche docente della Manutenzione presso i corsi master AICE-Bocconi, Architettura e Ingegneria della Sapienza Università di Roma. Ha scritto varie pubblicazioni e ha collaborato al libro in rete sulla Manutenzione dell’Ordine degli ingegneri di Roma (2008). 12/12 © Copyright