Valutazione del Globus
Toolkit
Massimo Sgaravatto
INFN Padova
Grid




“Hardware and software infrastructure that
provides dependable, consistent and pervasive
access to resources”
DB
Dependable: garanzia di funzionalita` e
performance
Consistent: interfaccia uniforme
a molte risorse di tipo diverso
DB
Pervasive: possibilita` di “plug in” da
qualsiasi posto
Massimo Sgaravatto
DB
DB
GRID: Problemi

Resource Management


Data Management




Come si fa lo staging dell’eseguibile nel nodo remoto ?
Come si fa partire la computazione remotamente ?
Come si gestisce ?
Security



Come si accede a data set remoti ?
Computation Management


Come si localizzano e si richiedono le risorse ?
...
Come si fa il “log in” nella Grid ?
Come si gestiscono le autorizzazioni ?
Massimo Sgaravatto
Globus




Progetto guidato da Ian Foster e
Carl Kesselman
Ricerca di base su GRID (resource management,
security, QoS, ...)
Sviluppo del Globus Toolkit
 Core service per tool e
applicazioni in GRID
GUSTO Testbed (~ 40 siti)
Massimo Sgaravatto
Globus Architecture
Applications
Testbed Status
High-level Services and
Tools CC++
MPI
MPI-IO
Nimrod/G
globusrun
GlobusView
DUROC
Core Services
Nexus
Metacomputing
Directory
Service
Gloperf
Condor
MPI
LSF
Easy
NQE
Globus
Security
Interface
Local
Services
Massimo Sgaravatto
GRAM
Heartbeat
Monitor
AIX
GASS
TCP
UDP
Irix
Solaris
Core Services








Communication infrastructure (Nexus)
Resource Management (GRAM)
Remote Data Access (GASS)
Executable Management (GEM)
Security (GSI)
Information Service (MDS)
Network Performance Monitor (GLOPERF)
Fault detection (HBM)
Massimo Sgaravatto
High Level Services





Librerie di I/O (MPICH, RIO, ....)
Linguaggi paralleli (CC++, HPC++)
Resource broker e co-allocator (DUROC,
Nimrod, ...)
Tool di monitoring (GlobusView, MDS
browser, ....)
...
Massimo Sgaravatto
Globus Security Infrastructure

Unica autenticazione



non bisogna gestire l’autenticazione sui
singoli nodi della GRID
Mapping tra GRID user-id e local user-id
Tecnologia a chiave pubblica (certificati
X.509)
Massimo Sgaravatto
Metacomputing Directory
Service

Gestione di informazioni (statiche e dinamiche)
su:



Interfaccia e protocollo standard (LDAP)


Risorse (host, sw configuration, load, resource
manager, ...)
Network (bandwidth, latenza)
Unico MDS server in USA
Informazioni:


Organizzate gerarchicamente in DIT (Directory
Information Tree)
Nuovi attributi definibili
Massimo Sgaravatto
MDS

Informazioni aggiornate da:




Globus (es. GRAM Reporter)
Utenti
Altri “provider” (es. SNMP)
Informazioni accedibili via:



comandi
applicazioni (API)
tool grafici
Massimo Sgaravatto
Resource Management



GRAM (Globus Resource Allocation Manager):
gestisce un insieme di risorse locali
Interfaccia uniforme a diversi sistemi di resource
management (Condor, LSF, PBS, fork, ...)
Resource Specification Language (RSL) per definire:


resource requirement (machine type, memoria, ...)
job definition (eseguibile, parametri, ...)
Es: & (ResourceManagementContact =
“cond.pd.infn.it:/C=US/.../CN=cond.pd.infn.itcondor”) (count=100) (executable=myapp)
Massimo Sgaravatto
Resource Management Architecture
Application
Resource and
Job specification
MDS
Resource
discovery
Data
discovery
Broker
Data
Catalog
Create
jobs
Site1
GRAM
GRAM
GRAM
CONDOR
LSF
fork
Site2
Massimo Sgaravatto
Site3
Remote Data Access


GASS (Global Access to Secondary Storage)
Naming attraverso URL:


Possibilita` di accedere a file da nodi remoti



Es: x-gass://host1.pd.infn.it:1234/filename
Caching
Necessita` di modificare il codice:
 open()  globus_gass_open()
 close()  globus_gass_close()
Possibilita` di spostare file a/da nodi remoti
Massimo Sgaravatto
Executable Management



Possibilita` di staging degli eseguibili sui
nodi remoti
stdin/stdout/stderr da un nodo remoto
Es:
& (executable=x-gass://host1.pd.infn.it:1234/~/myexe)
(stdin=ftp://ftp.pd.infn.it/inputs/myinp)
(stdout=/disk1/outputs/myout)
Massimo Sgaravatto
Altri servizi

Nexus Communication Library


HBM (Heartbeat Monitor)


Utilizzabile in diversi modelli di programmazione
(message passing, RPC, ecc…)
Rileva e notifica malfunzionamenti
GLOPERF (Globus Network Performance
Measurement Tool)

Misure di throughput e latency tra coppie di nodi
Massimo Sgaravatto
Use Case: studi HLT di CMS
Massimo Sgaravatto
First steps


Creazione di un testbed tra 5 siti (Bologna,
CNAF, LNL, Padova, Roma1)
Applicazione:


Resource Management





MC Prod.  Tutta la catena HLT
Submit di job su tutte le risorse del testbed
Implementazione broker
Resource manager locali: fork  Condor/LSF/…
Book-keeping
Globus MDS server italiano
Massimo Sgaravatto
People

INFN









Bologna
CNAF
LNL
Milano
Padova
Roma1
CERN (Fabrizio Gagliardi)
Universita` di Lecce (HPC Lab)
Universita` di Venezia (DI)
[email protected]
Massimo Sgaravatto
Scarica

Grid - INFN - Sezione di Padova