Tecnicamente l’affidabilità è la garanzia di un sistema o di un servizio di funzionare correttamente. Il Cloud può offrire questa garanzia ai massimi livelli. Capiamo assieme in che modo.
Il termine affidabile ha diverse connotazioni ed ognuna può assumere accezioni molto positive o molto negative.
Quando si parla di alta affidabilità vengono subito alla mente gli esami medici: solamente la loro alta affidabilità può garantire la salute pubblica dei cittadini.
Quando invece si parla di bassa affidabilità molte volte ci si riferisce a persone, aziende o istituzioni con le quali abbiamo avuto pessime esperienze.
In entrambi i casi l’enfasi che diamo al termine affidabile è sostanziale: se l’accezione è positiva ci sentiamo in grado di affidargli parti importanti della nostra vita quotidiana, diversamente non vogliamo neppure considerare l’ipotesi di avvicinarci, a meno di non esserne costretti.
Affidabilità e valore
Gran parte delle informazioni che custodiamo nei nostri sistemi informatici, cellulari compresi, devono essere sempre disponibili.
Per garantire questa disponibilità ci affidiamo a sistemi che reputiamo, o perlomeno speriamo che siano, altamente affidabili.
Più è elevato il valore delle informazioni che affidiamo a questi sistemi, maggiore è il grado di affidabilità che questi sistemi devono possedere.
Il valore delle informazioni è un aspetto che acquista sempre maggiore peso nella nostra vita quotidiana. Se un’informazione ha un alto valore intrinseco ma non è immediatamente disponibile, quando ne abbiamo bisogno, il suo valore si abbatte a favore di altre informazioni.
La disponibilità dell’informazione è garantita dall’affidabilità del sistema che la gestisce: maggiore è la disponibilità dell’informazione, maggiore è il valore che mantiene nel tempo.
Affidabilità, difettosità e malfunzionamenti
Ogni sistema informatico ha un grado più o meno elevato di difettosità dei suoi componenti. Questa difettosità è legata a diversi aspetti ma il primario è solitamente la qualità costruttiva.
Mentre la difettosità di un sistema è collegata alla fase di produzione, i malfunzionamenti sono legati ad altri aspetti:
- obsolescenza
- eventi esterni
- mancanza di manutenzione
L’architettura cloud può aiutarci ad ottenere sistemi altamente affidabili. L’affidabilità dei sistemi cloud è strettamente collegata al valore business delle soluzioni offerte: qualora un sistema cloud subisca un fermo prolungato l’impatto economico sul service provider è elevatissimo.
I service provider non possono permettersi di subire fermi prolungati per alcun motivo, ne per problemi di difettosità, ne per malfunzionamenti.
Mentre l’obsolescenza è facilmente aggirabile attraverso l’acquisto di nuove apparecchiature, gli eventi esterni (come ad esempio quelli atmosferici, elettrici o elettrostatici, per citarne alcuni) e la mancanza di manutenzione sono di più difficile gestione.
Tolleranza di errore e affidabilità
Come abbiamo visto in precedenza, per garantire la massima affidabilità dobbiamo raggiungere la massima disponibilità.
Se un sistema evidenzia un componente guasto, a seguito di una delle cause sopra esposte, il metodo più veloce per ripristinarne il funzionamento, e di conseguenza la disponibilità delle informazioni in esso contenute, è di sostituirlo con un suo gemello. Meglio ancora se questo avviene in automatico, senza la necessità di interventi umani.
Per ottenere la sostituzione del componente guasto in automatico dobbiamo affidarci alla ridondanza, ovvero alla duplicazione di ogni componente con un secondo componente gemello che può essere attivo o passivo. Se un componente gemello è attivo significa che può operare in parallelo con il suo gemello, ma in caso di necessità può subentrare nell’operatività e sostenere le funzionalità di entrambi. Se è passivo entrerà in gioco solamente quando il suo gemello va in crisi per qualsiasi ragione.
La sostituzione automatica di un componente difettoso con uno di backup è definita tolleranza di errore ed è nata per evitare ripercussioni ai clienti.
Tecnologia e ridondanza
Osserviamo l’infografica:

Quella rappresentata è una Region del cloud di Microsoft Azure.
Ogni Region è composta da almeno 2 Datacenter.
Ogni Datacenter è composto da diversi Stamp che sono degli insiemi di Rack.
Ogni Rack contiene decine di Server o Nodi, connessi tra di loro da una serie di apparati di rete denominati Top-of-Rack o TOR.
Ogni nodo contiene al suo interno: processori, memoria RAM e dischi rigidi (storage).
Possiamo facilmente capire che se anche un intero Stamp, contenente decine di server, si dovesse guastare la Region rimarrebbe comunque attiva, perché subentrerebbe un ulteriore Stamp a supporto.
Se anche un’intero Datacenter dovesse subire un malfunzionamento subentrerebbe il suo gemello nella Region.
Adesso pensate che Azure dispone di 54 Region a livello mondiale!
Le Region sono in relazione tra di loro e subentrano a supporto di una Region in difficoltà.
Con un livello di ridondanza di questa portata, di fatto, non esiste un evento a livello globale che può bloccare il cloud Azure.
Conclusioni
L’affidabilità è fondamentale per garantire il valore delle informazioni che affidiamo ad un cloud provider. Conoscerne l’architettura aiuta a capire il livello di tolleranza che può garantire.
A presto, nella prossima puntata parleremo di Sicurezza.