CMS I Tier2 in CMS Italia Massimo Biasotto - LNL M.Biasotto, Roma, 22 novembre 2001 1 CMS Sommario Stato attuale delle farm italiane Il Tier2 di riferimento a Legnaro/Padova Il servizio di analysis farm da implementare a LNL Conclusioni M.Biasotto, Roma, 22 novembre 2001 2 CMS Le farm italiane Tier1 M.Biasotto, Roma, 22 novembre 2001 Tier2+ Tier2 Tier3 3 CMS Stato attuale Sezione # CPU SI 95 Storage (TB) Bari 20 840 2.3 Bologna 28 1400 1.6 Catania 4 170 0.3 Firenze 50 (shared: 17) 1900 (shared: 630) 1.7 Legnaro 88 4400 10 Padova 30 1100 2.7 Perugia 16 800 1 Pisa 31 1500 2.4 Roma 25 1100 1.5 Torino 6 280 0.5 Totale 260 12200 24 M.Biasotto, Roma, 22 novembre 2001 4 CMS Evoluzione 2002 Sezione SI95 - 2001 SI95 - 2002 Storage-2001 Storage-2002 Bari 840 +300 2.3 +2 Bologna 1400 - 1.6 +2 Catania 170 +300 0.3 +1.2 Firenze 630 +300(?) 1.7 +2(?) Legnaro 4400 +3000(?) 10 +6 Padova 1100 +1000 2.7 - Perugia 800 - 1 - Pisa 1500 - 2.4 - Roma 1100 ? 1.5 +1.5(?) Torino 280 +200 0.5 +2 Totale 12200 +5100(?) 24 +16.7(?) M.Biasotto, Roma, 22 novembre 2001 5 CMS Riepilogo CPU SI95 8000 7000 6000 5000 2001 4000 2002 3000 2000 1000 0 BA M.Biasotto, Roma, 22 novembre 2001 BO CT FI LNL PD PG PI RM TO 6 CMS Riepilogo Storage Storage (TB) 18 16 14 12 10 2001 8 2002 6 4 2 0 BA M.Biasotto, Roma, 22 novembre 2001 BO CT FI LNL PD PG PI RM TO 7 CMS Layout tipico N1 FE N2 NODI DI CALCOLO S W I T C H GE Nx GATEWAY DISK SERVER Notevole uniformita’ delle farm sia nell’architettura che nel software (grazie anche al toolkit di installazione) Architettura tipica: – 1 gateway (accesso esterno, home utenti, sw applicativo) – storage centralizzato su 1 o piu’ disk servers in GigaEthernet – N nodi di calcolo in FastEthernet LAN M.Biasotto, Roma, 22 novembre 2001 8 CMS Storage: SCSI / EIDE Attualmente: – EIDE a BO, CT, LNL, PD, PG, PI, TO – SCSI a BA, FI, RM Costo per GB favorevole all’EIDE – SCSI 22k/GB (HD da 160) – EIDE 9k/GB (HD da 80) In arrivo per gli SCSI HD da 320GB, ma anche per gli EIDE HD da 160 I controller RAID per EIDE (3ware Escalade 6000, Adaptec 2400) offrono performance equivalenti agli SCSI nel RAID0 Per il RAID 5 invece rimane la superiorita’ degli SCSI, specialmente in scrittura (EIDE: ~15MB/s, SCSI: ~45MB/s), ma la situazione potrebbe evolvere M.Biasotto, Roma, 22 novembre 2001 9 CMS CPU Attualmente tutte le farm con Intel PIII (tipicamente 1GHz). Anche negli acquisti in corso si e’ rimasti sul PIII, nella versione Tualatin con 512MB di cache (a 1.13 o 1.26 GHz) Nessuno ha “rischiato” nel provare le alternative (Intel Xeon o AMD Athlon) che offrono frequenze di clock maggiori, fino a 2GHz A Padova nell’ambito del WP4 di INFNGRID stanno acquistando alcune di queste macchine: sarebbe interessante provare il software CMS per verificare se la maggiore velocita’ teorica corrisponde a reali benefici nella pratica. M.Biasotto, Roma, 22 novembre 2001 10 CMS Network BO BA CT 12Mb TO 12Mb 12Mb 4Mb FI 32Mb GRID RM ~ 34Mb 28Mb Gb 16Mb 16Mb PI PG M.Biasotto, Roma, 22 novembre 2001 4Mb GPOP PD LNL 28Mb PD ~ 10 Gb 11 CMS Layout Farm LNL 2001 34 Nodes 8 TB N1 1 N1 2 8 FastEth FastEth SWITCH SWITCH SWITCH S1 S10 N24 2001-2-3 up to 190 Nodes To WAN 34 Mbps 2001 ~ 1Gbps 2002 32 – GigaEth 1000 BT Nx – Computational Node Dual PIII – 1 GHz 512 MB 3x75 GB Eide disk + 1x20 GB for O.S. M.Biasotto, Roma, 22 novembre 2001 N1 N24 FastEth 2001 4400 SI95 2001 10 Servers 3 TB N24 S16 Sx – Disk Server Node Dual PIII – 1 GHz Dual PCI (33/32 – 66/64 512 MB 4x75 GB Eide Raid disks (exp up to 10) 1x20 GB disk O.S. 12 CMS Farm LNL 19” rack (5 kW) for network Equipments, Disks, etc. max 16 PC (5 kW) x shelf module max 64 PC (20 kW) x shelf (4 modules) ~ 6 KSI95 Now max 30 1U PC (10 kW) x rack ~ 3 KSI95 Now T2+ Rif. ~ 70 KSI95 ~ 250 TB 2002 2001 7m ~ 25 TB Now T2+ Prototype Max 200 Box T2+ Evolution Replacing old shelfs with 19” racks Max 1000 Boxes 10 m M.Biasotto, Roma, 22 novembre 2001 13 CMS M.Biasotto, Roma, 22 novembre 2001 Farm LNL 14 CMS Espansione Farm LNL Acquisti in corso con i finanziamenti 2002 anticipati al 2001: – 3TB dischi EIDE nei server gia’ esistenti – ~ 30 PC (computing nodes) – 3TB dischi SCSI + 3 PC disk-servers – Tape Library StorageTek L80 LTO (8TB in linea) finanziata dalla comm. calcolo Nei 3 servers con 3TB sara’ installato il DB che raccogliera’ tutte le produzioni fatte (non solo LNL ma tutta CMS Italia) Con questo DB si potra’ avviare un servizio di Analysis Farm, inizialmente per la comunita’ italiana e poi per tutta CMS. M.Biasotto, Roma, 22 novembre 2001 15 CMS Layout farm LNL 2002: produzione + analisi Production computing nodes N24 N1 N24 N1 N24 N1 FastEth FastEth FastEth SWITCH SWITCH SWITCH 32 – GigaEth 1000 BT Production servers M.Biasotto, Roma, 22 novembre 2001 S1 S10 S11 S12 S13 Analysis computing nodes To WAN 34 Mbps 2001 ~ 1Gbps 2002 Analysis servers 16 CMS La farm di analisi Come implementare il servizio di analisi per gli utenti CMS? Negli ultimi mesi esperienza limitata (muoni PD + altri) con account locali per gli utenti: non puo’ andar bene su scala piu’ estesa Servizio su piu’ livelli: – gennaio 2002 (quando arriva l’hardware): installazione e creazione del DB accesso remoto al DB: AMS su WAN – gennaio 2002: installazione GDMP possibilita’ di copia del DB via GDMP – inizio 2002: grid tools sottomissione remota di jobs di analisi in esecuzione locale su parte della farm M.Biasotto, Roma, 22 novembre 2001 17 CMS Grid tools per la farm di analisi (I) Utilizzo dei tools di grid per: – autenticazione e autorizzazione utenti remoti (certificati personali, VO LDAP server di CMS) – sottomissione remota di jobs (WP1 tools, anche senza Resource Broker) – data moving (WP2 tools: GDMP, GridFTP, ...) Gia’ avviati i test di questi tools, in concomitanza col Testbed di Datagrid In parallelo ed oltre ai test ufficiali per Datagrid, in alcuni siti CMS/Grid (LNL, PD, BO, ...) prove specifiche per verificare la corrispondenza dei tools alle nostre esigenze M.Biasotto, Roma, 22 novembre 2001 18 CMS Grid tools per la farm di analisi (II) CMS LDAP SERVER REPLICA CATALOG SERVER RESOURCE BROKER CNAF USER STORAGE ELEMENT GATE KEEPER COMPUTING ELEMENT LNL M.Biasotto, Roma, 22 novembre 2001 STORAGE ELEMENT GATE KEEPER COMPUTING ELEMENT PD --19 CMS Grid tools per la farm di analisi (III) Completati i test, installazione sulla farm Inizialmente con numero limitato di utenti. E’ necessario procedere per gradi perche’ si tratta di una cosa nuova (mai sperimentata neanche da altri) – efficienza dei tools in un ambiente reale? – impatto sulla farm di produzione? L’evoluzione successiva dipendera’ naturalmente dai riscontri via via ottenuti Se i risultati saranno positivi si potra’ pensare all’utilizzo dei grid tools anche per le produzioni M.Biasotto, Roma, 22 novembre 2001 20 CMS Conclusioni Il modello estremamente distribuito del calcolo di CMS Italia rappresenta da una parte un problema – necessita’ di sviluppare efficaci strategie e tools di coordinamento Grid tools, Impala, Boss, ... Ma dall’altra una grande opportunita’ – ampia base di esperienze stima rapporto ottimale CPU/Disco (0.1*e, 0.5<e<1) stima rapporto ottimale Server/Computing nodes (1:7) – possibilita’ di esplorare nuove idee M.Biasotto, Roma, 22 novembre 2001 21