Stella inattivaStella inattivaStella inattivaStella inattivaStella inattiva
 
Tizio alla scrivania che si rilassa Sempre dal blog dei ricercatori americani all'LHC, un altro post, dopo "Le gioie della Fisica" in cui un ricercatore, stavolta Zachary Marshall , ci spiega i motivi per cui sarà difficile che i volontari del progetto LHC@Home elaborino i dati prodotti dal più grande acceleratore di particelle del mondo.
.

 

È quasi come lavorare

Molti blogger hanno parlato della Grid di calcolo dell'LHC . Come fisici, utilizziamo molte risorse di calcolo. La homepage di WLCG presenta alcune interessanti informazioni su questa Grid, incluse delle stupende rappresentazioni di chi è online in quel momento.
 

screen-shot-2010-02-27-at-5.44.11-pm.jpg

 

C'è una cosa stupenda che deriva dall'uso di tutte queste risorse computazionali. Spesso, preparo dei lavori e li metto ad elaborare su qualche centinaio di computer che si trovano da qualche parte. Mi sento come se stessi lavorando un sacco, anche se sono i computer che stanno facendo tutta la parte pesante! Ciò consente anche di giustificare lunghe pause caffè: “Sto lavorando! La Grid sta frullando per me!!”

Ho speso molto del mio tempo lavorando al miglioramento del software di ATLAS (di solito tentando di renderlo più veloce). La maggior parte dei computer attuali consuma circa 80 Watt, circa come una lampadina ad incandescenza. Questo significa che, se li lasciamo accesi per un anno intero, spendiamo circa 100$ (80€) di elettricità per ogni computer in nostro possesso. La Grid di ATLAS (in realtà ce ne sono 3) utilizza circa 30000 computer, il che vuol dire che spendiamo circa 3 milioni di dollari l'anno in elettricità per farla funzionare.

Ovviamente, bisogna anche raffreddarle quelle macchine e c'è da dire che la maggior parte degli edifici in cui sono collocate non sono tra i più eleganti, moderni ed efficienti dal punto di vista energetico. Quindi potete immaginare che venga speso almeno altrettanto in costi di condizionamento, ossia altri 3 milioni di dollari (che è più o meno una stima corretta, basandosi sulle esperienze passate del CERN).

Di recente, ATLAS ha cambiato il sistema operativo sul quale facciamo funzionare le nostre applicazioni (come se si fosse passati da XP a Vista o da Leopard a Snow Leopard). Il sistema operativo che noi utilizziamo si chiama “Scientific Linux”. Siamo passati dalla versione 4 alla 5. Grazie ad alcuni curiousi trucchetti che sono stati introdotti con il cambio, il nostro software gira d'improvviso il 20% più veloce.

Quindi un upgrade del sistema operativo ci consente di risparmiare 1,2 milioni di dollari l'anno!

In realtà non è del tutto vero. L'elettricità per i computer della Grid è piuttosto economica rispetto ad altre componenti del budget. Quindi, piuttosto che spegnere i computer, li facciamo lavorare di più così possiamo processare più dati nella stessa quantità di tempo. Nonostante tutto, è una bella cosa! E piccoli calcoli come questo mi fanno pensare che dovrebbero darmi un bonus ogni volta che rendo il software un po' più veloce...

Richard mi ha chiesto di LHC@Home dopo il mio ultimo post. Potete leggere tutto a riguardo sul loro sito . È un progetto interessante e abbiamo parlato di vari modi per utilizzarlo. Ci sono però alcuni problemi che meritano di essere spiegati (NB: sono solo un blogger, è un'opinione personale).

 

lhc_screensaver.jpg

 

Un problema è che il software che utilizziamo è piuttosto grande. L'installazione tipica richiede 7 GB e funziona in maniera nativa su sistemi Linux. Oltre a quello, i file dei dati sono grossi qualche altro GB. Non ci sono molte persone che vogliono fregarsi 15 GB di spazio sull'hard disk per un simpatico screen saver e quindi dobbiamo pensare attentantemente a come realizzare una versione “snellita” da inviare e far funzionare su sistemi Windows o Apple (per raggiungere un'audience più vasta).

Un altro problema è che i nostri dati sono “sensibili”. Per sfruttare fino in fondo i computer dei nostri amici, dovremmo voler dare loro pieno accesso ai nostri dati. Ma vogliamo essere i primi a pubblicare i risultati di quei dati! Quindi ci renderebbe un po' nervosi inviare semplicemente i dati a chiunque ce li richieda. Ancora peggio e più probabilmente, ci sarebbe qualcuno che proverebbe ad usarli ma senza capirli e finirebbe per non identificare qualcosa di realmente interessante. E quindi a noi toccherebbe usare il nostro tempo - invece che per le analisi - per tentare di mettere a posto gli errori di qualcun altro. C'è stata una discussione interessante in proposito ad una conferenza a cui ho partecipato qualche anno fa. Qualcuno chiese che tutti i dati di LHC fossero messi a disposizione del pubblico. Ovviamente, utilizzammo l'obiezione appena menzionata. Subito dopo una persona domandò: “I dati di un precedente esperimento del CERN (chiamato LEP) sono pubblici. Qualcuno li ha mai guardati?” Nessuno, al di fuori di quelli coinvolti nell'esperimento, l'aveva fatto. Quindi un altro motivo per non renderli pubblici.

Un ulteriore problema ha a che fare con le “condizioni”. Quello che ricaviamo dai sensori dipende dallo stato in cui sono nel momento della rilevazione: che componenti sono in uso, a che temperatura sono, che voltaggio è utilizzato e così via. Tutte queste informazioni (le “condizioni” appunto) sono conservate in un enorme database al CERN. Ogni volta che vogliamo usare i dati dobbiamo anche considerare queste condizioni e quindi andare a cercarle nel database. Se più di qualche migliaio di persone tentasse di collegarsi al database contemporaneamente, verrebbe giù tutto e nessuno potrebbe usarlo! Abbiamo dei duplicati in giro per il mondo per ridurre la probabilità che accada. Oltre a quello, abbiamo dei server di caching. Quando chiedi delle informazioni al database, questi controllano se le hanno già a disposizione e solo se necessario vanno a pescarle dal database originale. In questo modo le condizioni usate più spesso sono disponibili con facilità. Ma non sono sicuro che l'infrastruttura sia in grado di reggere tantissime nuove persone che richiedono informazioni! E sarebbe rischioso lanciare un programma che potrebbe portare il nostro lavoro ad uno stop proprio ora che l'LHC sta iniziando a funzionare!

Certo, la legge di Moore continua a tenere e i computer diventano sempre più economici. Quindi per il 2020 tutto potrebbe essere facile e tutti potrebbero star usando il nostro software come screen saver. Ma per ora, è piuttosto difficile!

Zach


Accedi per commentare