Shanghai, China

Excelencia en las operaciones: Garantizar un rendimiento sin fisuras del centro de datos

7 de octubre de 2024

Escrito por: Tina Tsui, Directora de Marketing de Chayora

En un artículo anterior, Construcción integral de centros de datos: Del proyecto a la realidad Tina Tsui, Chayora Director de Marketing, analizó los retos y soluciones de la construcción de centros de datos de extremo a extremo, desde el diseño hasta el funcionamiento. La asociación estratégica de EdgeConneX con Chayora ofrece ofertas de centros de datos EdgeConneX en Pekín y Shanghaidos de los mayores mercados de China. En este artículo, Tsui se centrará en las estrategias operativas necesarias para mantener un centro de datos de alto rendimiento. La Sra. Tsui Tina Tsui Headshotexplica cómo la eficacia de las operaciones es crucial para mantener la eficiencia y evitar interrupciones en el negocio. Mediante la excelencia en las operaciones, las organizaciones pueden minimizar los errores humanos, garantizando la estabilidad y fiabilidad de los centros de datos, que sirven de columna vertebral para la transformación digital. Lea a continuación su análisis en profundidad: 

¿Quién asume el coste de los fallos de los centros de datos?

En la era digital actual, los centros de datos se han convertido en infraestructuras críticas para empresas y organizaciones. Almacenan, procesan y salvaguardan grandes volúmenes de datos y dan soporte a diversas aplicaciones y servicios. Sin embargo, el funcionamiento de los centros de datos conlleva numerosos retos, como minimizar el tiempo de inactividad.

Los tiempos de inactividad interrumpen las operaciones empresariales, provocan pérdidas económicas y dañan la reputación de una empresa. Según la última encuesta de Uptime Institute, cada año se producen entre 10 y 20 fallos graves en los centros de datos de todo el mundo, que provocan importantes daños económicos y de reputación. Más de la mitad de los operadores encuestados declararon que el coste de su interrupción grave más reciente superó los 100.000 dólares.1. 

Evitar interrupciones es una prioridad crucial para los operadores de infraestructuras digitales, lo que pone de relieve la importancia de la excelencia operativa. Los centros de datos pueden lograr un rendimiento eficiente, fiable y seguro mediante operaciones de primer nivel, proporcionando un soporte de infraestructura digital estable a los operadores, reduciendo los costes operativos y mejorando los beneficios económicos.

Para evitar las interrupciones en la medida de lo posible, los expertos se esfuerzan por garantizar la excelencia en todos los aspectos de las operaciones del centro de datos, mejorando la capacidad de recuperación. Esto incluye el uso de sistemas de alimentación ininterrumpida (SAI) de reserva de energía, cableado de fibra diversificado con rutas redundantes, generadores de reserva y diseños de servidores redundantes para garantizar un servicio continuo durante los fallos de alimentación, red o hardware.

Estas medidas mejoran significativamente la disponibilidad y resistencia de los centros de datos, permitiéndoles ofrecer un servicio ininterrumpido y fiable a los usuarios. Sin embargo, incluso los diseños optimizados sólo pueden evitar parcialmente las interrupciones en los centros de datos. El informe "Annual Outage Analysis 2023" del Uptime Institute revela que el error humano sigue siendo una causa importante de los fallos en los centros de datos2.

Errores humanos: El talón de Aquiles de los centros de datos

Los centros de datos albergan numerosos servidores, dispositivos de almacenamiento y equipos de red que requieren supervisión, configuración y mantenimiento manuales para garantizar su correcto funcionamiento y eficiencia. Dada la escala y complejidad de estos dispositivos, los errores humanos son casi inevitables. Estos errores pueden incluir:

  • Configuración incorrecta de redes, servidores o dispositivos de almacenamiento.
  • Los errores operativos incluyen la desconexión accidental de equipos críticos o la realización de tareas de mantenimiento inadecuadas.
  • Actualizaciones de software o gestión de parches inadecuadas.
  • Vulnerabilidades de seguridad debidas a negligencias en las operaciones.

Como gestores y encargados del mantenimiento de los centros de datos, los operadores son responsables de garantizar el funcionamiento normal de los equipos y la infraestructura, al tiempo que evitan las interrupciones causadas por errores de mantenimiento o configuración. Para ello es necesario supervisar en tiempo real el estado de los equipos, realizar comprobaciones periódicas, mantener infraestructuras cruciales como los sistemas de refrigeración y alimentación, y gestionar meticulosamente los cambios para garantizar que todas las tareas de mantenimiento estén bien planificadas, probadas y verificadas.

El informe del Uptime Institute también indica que muchos incidentes relacionados con errores humanos se deben a que el personal no sigue los procedimientos o a errores de procedimiento.3. De 2019 a 2022, la mayoría de los gestores y operadores indicaron que una gestión y unos procesos mejores podrían haber mitigado el impacto de las interrupciones.

Excelencia en las operaciones: Una respuesta de alta puntuación para la continuidad empresarial

Chayora Shanghai DC rendering
Centro de datos de Chayora en Shanghai

Alcanzar la excelencia operativa y minimizar los errores humanos es primordial para la estabilidad de los centros de datos. Esto implica una supervisión proactiva, el desarrollo del talento y la certificación externa para reducir la probabilidad de interrupciones debidas a errores humanos. Exploremos la importancia de estas tres medidas:

1. Supervisión proactiva: Los centros de datos necesitan sistemas de supervisión completos y proactivos para realizar un seguimiento en tiempo real de parámetros críticos como el rendimiento de la red, el suministro eléctrico, la temperatura, la humedad y la seguridad. Esto ayuda a identificar posibles problemas en una fase temprana y a tomar medidas preventivas, minimizando el impacto de los fallos. La integración de capacidades de IA puede mejorar aún más la automatización y la inteligencia de los sistemas de supervisión en el contexto de los rápidos avances en IA y grandes modelos lingüísticos.

2. Desarrollo del talento: Contar con personal cualificado y ofrecer formación continua y oportunidades de desarrollo es crucial para un funcionamiento eficiente de los centros de datos. Los centros de datos requieren profesionales cualificados para mantener y gestionar las instalaciones, por lo que es esencial adecuar científicamente la estructura del equipo a las necesidades operativas, garantizando la experiencia suficiente para afrontar retos técnicos complejos. Según el Uptime Institute, un personal bien formado y unos procedimientos minuciosamente planificados y ensayados son vitales para reducir las interrupciones y maximizar el ahorro de costes.

3. Certificación externa: La obtención de certificaciones relevantes del sector, como las certificaciones de diseño, construcción y funcionamiento del Uptime Institute, proporciona una prueba objetiva y autorizada del cumplimiento, la fiabilidad y la seguridad de un centro de datos. Las certificaciones externas suelen incluir auditorías de sistemas, procesos, controles, medidas de seguridad y capacidades de recuperación ante desastres, lo que ayuda a los centros de datos a identificar y corregir problemas existentes o riesgos potenciales, establecer sistemas de gestión eficientes y mejorar la concienciación sobre los riesgos.

Chayora alcanza la excelencia operativa a través de la supervisión proactiva, la formación del talento y la certificación externa. Su variado equipo de operaciones está formado por expertos de empresas tecnológicas globales y gigantes de la nube pública, que ofrecen soporte de servicio local y remoto. El sistema de gestión centralizada de 360 grados de Chayora mejora la eficiencia operativa en un 15% mediante una gestión inteligente, lo que le ha valido el reconocimiento y los elogios del sector y los clientes. En la 11ª Conferencia de Estándares de Centros de Datos, este sistema ganó el "Data Center Achievement Award" otorgado por la Asociación China para la Estandarización de la Construcción de Ingeniería. Los clientes del campus de Chayora en Tianjin destacaron en una carta de agradecimiento que los excepcionales servicios de operaciones de Chayora cumplen altos estándares de seguridad y fiabilidad al tiempo que ofrecen operaciones ágiles y flexibles, logrando dos años de cero fallos y anticipándose proactivamente a las necesidades del cliente.

La excelencia en las operaciones es crucial para mejorar la eficiencia de los centros de datos y la calidad del servicio, reducir costes, aumentar la competitividad y lograr un desarrollo sostenible. Impulsa la capacidad individual, la colaboración en equipo y la innovación, garantizando la seguridad y la estabilidad de los centros de datos, abordando mejor las amenazas a la seguridad y los retos operativos en constante evolución, y proporcionando un sólido apoyo al desarrollo digital e inteligente.

En esta serie del "Observatorio IDC", analizamos nuevas tendencias y soluciones optimizadas para centros de datos en el contexto de la economía digital y la alta potencia de cálculo.

Frente a los avances y desafíos de los tiempos, Chayora cree que mejorando continuamente la resistencia y la adaptabilidad, los centros de datos pueden satisfacer las demandas de una era cada vez más digital, inteligente y ecológica. En el futuro, Chayora seguirá el ritmo de los tiempos, aportando más ideas interesantes sobre los centros de datos, y cubrirá más temas relacionados con los centros de datos personalizados de alta densidad en próximas series. Permanezca atento.

Lea la serie Chayora IDC aquí:

Notas a pie de página

1. Análisis anual de interrupciones del Uptime Institute 2024

2. Análisis anual de interrupciones del Uptime Institute 2023

3. Análisis anual de interrupciones del Uptime Institute 2023