La Comunità e l'Associazione dei Sistemisti Informatici della Pubblica Amministrazione

Ilger

Comune di Segrate: l'impianto di condizionamento è parte fondamentale di una server farm

L'impianto di condizionamento è una parte fondamentale di una server farm. Per fare un esempio, tra il 2009 e il 2012, nel mio Comune (Segrate), si sono verificate due situazioni di blocco dei servizi informatici e una di queste è stata causata da un malfunzionamento dell'impianto di condizionamento.

Cosa è successo

Il condizionatore si è rotto venerdi' sera (un bestione da 36000btu). Ilsabato mattina, giorno di apertura degli sportelli, nessun problema rilevato, in quanto i server non hanno raggiunto la temperatura critica (55 gradi, da specifiche tecniche). Durante il fine settimana il sistema ha continuato a funzionare regolarmente e solo lunedi' mattina alle 7 si è spento (in autonomia) il primo server, quello in alto nell'armadio rack.

 

Alle 8 ci siamo accorti della situazione e abbiamo spento tutti gli apparati (per evitare altri blocchi inattesi) avvisando tutti i colleghi dello stato di disastro temporaneo.

Gli apparati presenti nella sala server:

1) 5 server fisici

2) 3 switch HP pro curve

3) 2 firewall

4) 4 gruppi di continuità

La temperatura nel locale alle 8.00 era di 59 gradi! Da notare che solo uno degli apparati presenti si è spento, gli altri hanno solo rilevato nel loro event log un "livello critico di temperatura" ma hanno continuato a lavorare e non hanno avuto conseguenze. Per dovere di cronaca erano dei fujitsu-siemens RX presi in convezione Consip. Dei veri muli. Si dice che l'esercito italiano li abbia acquistati per portarli nelle missioni in afganistan.

In due ore l'ufficio tecnico, supportato dal fornitore, ha installatoo un piccolo daikin da 12000btu che in un paio d'ore ha riportato la temperatura del locale a valori accettabili. Alle 13 abbiamo dichiarato la fine della situazione di disastro, acceso i server e gli sportelli sono stati riaperti al pubblico.

Azioni intraprese

Il condizionatore principale è stato sostituito da un samsung da 24000btu a cui è rimasto affiancato il daikin da 12000btu.

Inizialmente abbiamo impostato il principale su una temperatura di 21 gradi e il secondario su una di 22. Ma il tecnico ci ha fatto giustamente notare che il secondario avrebbe buttato fuori aria calda per cercare di portare la temperatura a 22 gradi!!! Quindi tutti e due impostati su una temperatura di 21 gradi.

Il locale server è di circa 12mq e i cinque server fisici sono stati sostituiti da un server bladeS con storage integrato.

I due condizionatori, impostati sui 21 gradi, lavoro praticamente sempre al minimo.

Una curiosità

I disastri e i blocchi della server farm si possono prevedere ed evitare. Si possono fare statistiche sulle probabilità di rottura di ogni singolo apparato. Ma una cosa non abbiamo considerato: una primavera esplosa nella sua calura che ha creato una produzione di polline fuori dal normale. Ebbene si, la causa del disastro è stato il polline che ha otturato prima il filtro del motore esterno e poi ha fatto bruciare il motore stesso che si è surriscaldato (strano destino per un condizionatore!). E pensare che l'avevamo pulito giovedi' sera.

Che dire, la natura questa volta non ci ha dato una mano....

Alessandro

Categoria: