In un articolo precedente, Realizzazione completa di un data center: dal progetto alla realizzazione Tina Tsui, Chayora Il direttore marketing ha illustrato le sfide e le soluzioni relative alla realizzazione di data center end-to-end, dalla progettazione alla gestione operativa. La partnership strategica tra EdgeConneX e Chayora consente di offrire le soluzioni di data center di EdgeConneX in Pechino e Shanghai, due dei più grandi mercati della Cina. In questo articolo, la signora Tsui si concentrerà sulle strategie operative necessarie per garantire l'ottimo funzionamento di un data center. La signora Tsui
spiega come l'efficacia delle operazioni sia fondamentale per mantenere l'efficienza e prevenire interruzioni dell'attività. Grazie all'eccellenza operativa, le organizzazioni possono ridurre al minimo gli errori umani, garantendo la stabilità e l'affidabilità dei data center, che costituiscono la spina dorsale della trasformazione digitale. Continua a leggere qui sotto per scoprire la sua analisi approfondita:
Chi si fa carico dei costi derivanti dai guasti dei data center?
Nell'era digitale odierna, i data center sono diventati un'infrastruttura fondamentale per le aziende e le organizzazioni. Essi archiviano, elaborano e proteggono enormi quantità di dati, supportando diverse applicazioni e servizi. Tuttavia, la gestione dei data center comporta numerose sfide, come ad esempio la riduzione al minimo dei tempi di inattività.
I tempi di inattività compromettono le operazioni aziendali, causano perdite finanziarie e danneggiano la reputazione dell'azienda. Secondo l'ultima indagine condotta da
Secondo l'Uptime Institute, ogni anno si verificano in tutto il mondo dai 10 ai 20 gravi incidenti nei data center, che causano ingenti danni economici e reputazionali. Oltre la metà degli operatori intervistati ha dichiarato che il costo della loro più recente interruzione grave ha superato i 100.000 dollari1.
Evitare le interruzioni è una priorità fondamentale per gli operatori di infrastrutture digitali, il che sottolinea l'importanza dell'eccellenza operativa. I data center possono garantire prestazioni efficienti, affidabili e sicure grazie a operazioni di altissimo livello, fornendo agli operatori un supporto stabile per le infrastrutture digitali, riducendo i costi operativi e aumentando i benefici economici.
Per ridurre al minimo le interruzioni, gli esperti si impegnano a garantire l'eccellenza in ogni aspetto delle operazioni dei data center, migliorandone la resilienza. Ciò comprende l'utilizzo di sistemi di alimentazione elettrica ininterrotta (UPS) per il backup dell'alimentazione, un cablaggio in fibra ottica diversificato con percorsi ridondanti, generatori di riserva e configurazioni ridondanti dei server, al fine di garantire la continuità del servizio in caso di interruzioni di corrente, guasti di rete o malfunzionamenti hardware.
Queste misure migliorano notevolmente la disponibilità e la resilienza dei data center, consentendo loro di fornire agli utenti un servizio ininterrotto e affidabile. Tuttavia, anche i progetti ottimizzati possono prevenire solo in parte le interruzioni dei data center. Il rapporto «Annual Outage Analysis 2023» dell’Uptime Institute rivela che l’errore umano rimane una causa significativa dei guasti nei data center2.
Errori umani: il tallone d'Achille dei data center
I data center ospitano numerosi server, dispositivi di archiviazione e apparecchiature di rete che richiedono monitoraggio, configurazione e manutenzione manuali per garantire il corretto funzionamento e l'efficienza. Data la portata e la complessità di questi dispositivi, gli errori umani sono quasi inevitabili. Tali errori potrebbero includere:
- Configurazione errata di reti, server o dispositivi di archiviazione.
- Tra gli errori operativi figurano lo spegnimento accidentale di apparecchiature fondamentali o l'esecuzione di interventi di manutenzione non corretti.
- Gestione inadeguata degli aggiornamenti software o delle patch.
- Vulnerabilità di sicurezza dovute a negligenza nelle operazioni.
In qualità di responsabili della gestione e della manutenzione dei data center, gli operatori hanno il compito di garantire il regolare funzionamento delle apparecchiature e delle infrastrutture, prevenendo al contempo le interruzioni causate da errori di manutenzione o di configurazione. Ciò richiede un monitoraggio in tempo reale dello stato delle apparecchiature, controlli periodici, la manutenzione delle infrastrutture fondamentali, quali i sistemi di raffreddamento e di alimentazione, nonché una gestione meticolosa delle modifiche, al fine di garantire che tutti gli interventi di manutenzione siano ben pianificati, testati e verificati.
Il rapporto dell’Uptime Institute indica inoltre che molti incidenti legati a errori umani sono dovuti al mancato rispetto delle procedure da parte del personale o a errori procedurali3. Dal 2019 al 2022, la maggior parte dei manager e degli operatori ha indicato che una gestione e dei processi migliori avrebbero potuto mitigare l’impatto delle interruzioni di servizio.
Eccellenza operativa: una soluzione di grande efficacia per la continuità operativa

Il raggiungimento dell'eccellenza operativa e la riduzione al minimo degli errori umani sono fondamentali per la stabilità dei data center. Ciò comporta un monitoraggio proattivo, lo sviluppo delle competenze del personale e l'ottenimento di certificazioni esterne, al fine di ridurre il rischio di interruzioni del servizio dovute a errori umani. Esaminiamo l'importanza di queste tre misure:
1. Monitoraggio proattivo: I data center necessitano di sistemi di monitoraggio completi e proattivi per tenere traccia in tempo reale di parametri critici quali le prestazioni di rete, l'alimentazione elettrica, la temperatura, l'umidità e la sicurezza. Ciò consente di identificare tempestivamente potenziali problemi e di intraprendere azioni preventive, riducendo al minimo l'impatto dei guasti. L'integrazione delle funzionalità di IA può migliorare ulteriormente l'automazione e l'intelligenza dei sistemi di monitoraggio, alla luce dei rapidi progressi nell'ambito dell'IA e dei modelli linguistici di grandi dimensioni.
2. Sviluppo delle competenze: Disporre di personale qualificato e offrire opportunità di formazione e sviluppo continui è fondamentale per garantire l'efficienza operativa dei data center. I data center necessitano di professionisti qualificati per la manutenzione e la gestione delle strutture; è quindi essenziale allineare scientificamente la struttura del team alle esigenze operative, garantendo competenze sufficienti per affrontare sfide tecniche complesse. Secondo l'Uptime Institute, un personale ben addestrato e procedure accuratamente pianificate e collaudate sono fondamentali per ridurre le interruzioni di servizio e massimizzare i risparmi sui costi.
3. Certificazioni esterne: L'ottenimento di certificazioni di settore pertinenti, come quelle relative alla progettazione, alla costruzione e alla gestione rilasciate dall'Uptime Institute, fornisce una prova oggettiva e autorevole della conformità, dell'affidabilità e della sicurezza di un data center. Le certificazioni esterne comportano spesso audit di sistemi, processi, controlli, misure di sicurezza e capacità di disaster recovery, aiutando i data center a identificare e correggere problemi esistenti o rischi potenziali, a stabilire sistemi di gestione efficienti e a migliorare la consapevolezza dei rischi.
Chayora raggiunge l'eccellenza operativa attraverso un monitoraggio proattivo, la formazione del personale e la certificazione esterna. Il suo team operativo, composto da figure diversificate, comprende esperti provenienti da aziende tecnologiche globali e giganti del cloud pubblico, in grado di offrire assistenza sia in loco che da remoto. Il sistema di gestione centralizzata a 360 gradi di Chayora migliora l'efficienza operativa del 15% grazie a una gestione intelligente, ottenendo riconoscimenti e elogi da parte del settore e dei clienti. All'11ª Conferenza sugli standard dei data center, questo sistema ha vinto il "Data Center Achievement Award" assegnato dall'Associazione cinese per la standardizzazione delle costruzioni ingegneristiche. I clienti del campus di Chayora a Tianjin hanno sottolineato in una lettera di ringraziamento che gli eccezionali servizi operativi di Chayora soddisfano elevati standard di sicurezza e affidabilità, offrendo al contempo operazioni agili e flessibili, raggiungendo due anni di zero guasti e anticipando in modo proattivo le esigenze dei clienti.
L'eccellenza operativa è fondamentale per migliorare l'efficienza dei data center e la qualità del servizio, ridurre i costi, rafforzare la competitività e garantire uno sviluppo sostenibile. Essa potenzia le capacità individuali, la collaborazione di squadra e l'innovazione, garantendo la sicurezza e la stabilità dei data center, affrontando in modo più efficace le minacce alla sicurezza e le sfide operative in continua evoluzione e fornendo un solido supporto allo sviluppo digitale e intelligente.
In questa serie "IDC Observatory" abbiamo analizzato le nuove tendenze e le soluzioni ottimizzate per i data center nel contesto dell'economia digitale e dell'elevata potenza di calcolo.
Di fronte agli sviluppi e alle sfide del momento, Chayora ritiene che, rafforzando costantemente la resilienza e l'adattabilità, i data center possano soddisfare le esigenze di un'era sempre più digitale, intelligente ed ecologica. In futuro, Chayora continuerà a stare al passo con i tempi, offrendo ulteriori approfondimenti interessanti sui data center e trattando, nelle prossime puntate, ulteriori argomenti relativi ai data center personalizzati ad alta densità. Restate sintonizzati!
Leggi qui la serie Chayora IDC:
- Realizzazione completa di un data center: dal progetto alla realizzazione
- Implementazione agile e flessibile dei data center: accelerare l'innovazione
- L'ascesa della potenza di calcolo: il futuro dei data center ad alta densità
- L'era dell'AIGC: come i data center di Chayora stanno rivoluzionando la potenza di calcolo
Note a piè di pagina
1. Analisi annuale delle interruzioni di servizio 2024 dell'Uptime Institute
2. Analisi annuale delle interruzioni di servizio dell'Uptime Institute 2023
3. Analisi annuale delle interruzioni di servizio dell'Uptime Institute 2023