Storage Area Network, una strada nuova per i dati

Le Storage Area Network promettono una gestione più efficiente dei dati e dello storage aziendale

Molti dati in rete

L'idea di Storage Area Network nasce dalla constatazione che le attività aziendali si basano sempre più sull'acquisizione e sull'elaborazione di grandi quantità di dati, i quali vanno naturalmente memorizzati in sistemi di storage e fatti transitare sulle reti delle imprese. Chi dialoga attraverso reti pubbliche (Internet su tutte) o private con i propri partner o clienti, ha la necessità di muovere dati in grandi quantità e in maniera veloce e sicura, requisiti che non sempre una organizzazione "classica" dello storage può soddisfare. In molte realtà, infatti, viene adottata una configurazione dei sistemi di memorizzazione che viene definita SAS, o Server Attached Storage, in cui le unità a nastro o a disco sono integrate nei server aziendali (come accade in qualsiasi pc) o sono contenute in dispositivi esterni (i "disk array" nel caso dei dischi) connessi poi ai server tramite attacchi SCSI o, nel caso dei sistemi midrange o mainframe, collegamenti ESCON/FICON. Si tratta di una organizzazione funzionale, ma che presenta alcuni limiti.

I contro delle SAN

Nelle configurazioni Server Attached Storage il server diventa un inevitabile "snodo" di transito per qualsiasi accesso ai dati memorizzati sui dischi o sui nastri a esso collegati: se un client deve scaricare un file, la CPU del server deve intercettare la sua richiesta ed elaborarla, sottraendo risorse alle altre operazioni che deve svolgere. E' per questo motivo che nelle piccole LAN da ufficio il file server centrale deve essere una macchina caratterizzata da un buon livello di potenza in termini di CPU, memoria RAM e schede dedicate alle operazioni di I/O. Oltre un certo numero di client attivi, quindi, qualsiasi server diventa un collo di bottiglia, rallentando l'accesso ai dati da parte degli utenti posizionati sulla LAN aziendale. In quanto "snodo" del traffico delle informazioni, il server diventa anche un pericoloso punto debole della rete. Un altro importante aspetto di cui tenere conto è che i dati diretti verso il server (o che ne provengono) transitano sulla stessa LAN che i client utilizzano per le loro normali operazioni: posta elettronica, navigazione in Internet, elaborazione di transazioni varie e via dicendo. Ciò significa che in molti casi, a seconda del numero di client o delle operazioni di spostamento dei dati, la banda richiesta dai trasferimenti delle informazioni memorizzate sui server può rallentare tutte le altre operazioni. Per le piccole imprese con pochi client e pochi server che svolgono le classiche operazioni "da ufficio", si tratta di problemi con i quali è possibile convivere. Le grandi aziende con data warehouse "monolitici" aggiornati e analizzati di continuo e in particolare i fornitori di contenuti per il Web (ISP, carrier e così via) guardano invece con interesse a soluzioni alternative.

L'idea delle SAN

Se il transito dei dati sulla LAN e attraverso i server rappresenta un problema, la soluzione immediata è limitarlo il più possibile. Le Storage Area Network concretizzano questo concetto apparentemente semplice, adottando una struttura in cui i dispositivi di memorizzazione e backup "dialogano" attraverso una loro rete (la SAN, appunto) mentre tutto il traffico tra client e server che non riguarda l'accesso alle informazioni rimane confinato nella LAN. Strutturalmente una SAN è una rete locale vera e propria, che comprende i nodi (i dispositivi di storage), gli hub e gli switch necessari a incanalare il traffico delle informazioni e il software di gestione per controllare tutta l'infrastruttura. La SAN e la LAN sono quindi due entità fisicamente separate; a fare da ponte tra loro troviamo uno o più server, che ora però non sono strettamente associati con uno o più specifici dispositivi di storage. Con una configurazione, per esempio, un sistema a dischi che debba replicarsi su un altro disk array può trasferire tutti i suoi dati direttamente alla "controparte", senza coinvolgere i server come elementi di transito e senza occupare la banda della LAN. Lo stesso può avvenire per le operazioni di backup su nastro, dando vita al cosiddetto "serverless backup". Naturalmente un minimo coinvolgimento dei server esiste anche in queste attività, ma solo per le operazioni di gestione, programmazione o avvio dei trasferimenti dei dati.

Utilizzare uno switch o un più potente director permette di condividere le risorse di storage tra più server, anche basati su sistemi operativi differenti. Come indicato nel grafico, i dischi e i nastri della SAN vengono partizionati tra le diverse piattaforme operative. Possono esistere funzioni di conversione e condivisione dei dati anche senza mantenere più copie (una per ogni sistema operativo) delle informazioni, ma ciò dipende dal software di gestione che viene utilizzato.

Nuove tecnologie

Un particolare elemento di novità per le SAN è stata l'adozione, almeno nell'idea iniziale, della tecnologia Fibre Channel come sola infrastruttura di connessione, sia pure con qualche "apertura" a SCSI, tra i sistemi di storage e tra questi e i server. Ma perché spingere una tecnologia poco diffusa, introducendo un apparente elemento di complessità in più? Il motivo è la ricerca di una maggiore ampiezza di banda nelle comunicazioni fra i dispositivi di memorizzazione in rete: SCSI, la tecnologia più diffusa nel mondo storage, oggi offre una banda di comunicazione ampia (160 MB/sec nella sua versione più recente) ma un preciso limite nella lunghezza massima dei collegamenti (25 metri) e nel numero di dispositivi (15) che possono costituire una catena SCSI; Fibre Channel offre una banda di circa 1 Gbps, equivalenti a un trasfer rate di 100 MB/sec, per connessioni su fibra ottica sino a 10 chilometri senza amplificatori di segnale e supporta sia configurazioni ad anello, con un massimo di 126 nodi, che commutate attraverso uno switch. Per l'anno prossimo si prevede inoltre la diffusione di Fibre Channel a 2 Gbps. Oggi viene naturale pensare anche all'adozione del protocollo IP, non fosse altro che per la sua diffusione e per mantenere SAN e LAN omogenee, ma due anni fa la banda offerta da IP era decisamente minore (i 100 Mbps, ossia 10 MB/sec, di Fast Ethernet) perché Gigabit Ethernet era ancora una tecnologia poco diffusa. Con la crescita di Gigabit Ethernet e la prospettiva di avere reti Ethernet anche a 10 Gbps lo scenario si è modificato, ma Fibre Channel rimane un protocollo nato per trasportare dati, mentre IP lo è per trasferire transazioni. Il tema dello storage su IP è comunque ricco di dibattiti.


Per tutti coloro che necessitano di ulteriori chiarimenti vi invitiamo a contattarci allo 035.962497 o compilando il Form al seguente Link.