Etiquetas

, , , , ,

Las soluciones de Cloud Computing (Iaas, Paas, y SaaS) mejoran la eficiencia y elasticidad de la operaciones de las TIC, al permitir un mejor aprovechamiento de las plataformas TIC con el subsiguiente ahorro energético, al tiempo que permiten ofrecer servicios más aquilatados en costes y con modelo de facturación de pago por uso.

Sin embargo, las infraestructuras Cloud hacen uso extensivo e intensivo de la virtualización, y los D.C. tienden a ser entornos muy dinámicos en las cuales las cargas de trabajo virtualizadas migran libremente entre servidores físicos, al tiempo que se produce la aparición de nuevas cargas y la desaparición de otras hasta ese momento operativas.

Esta deseada agilidad de las TIC si no es gestionada adecuadamente puede traer, por el contrario, efectos no deseados e incluso contradictorios con sus teóricas ventajas: aprovechamiento energético no-óptimo (e incluso derroche energético), pérdidas de servicio, etc., es decir, por citar un par de ejemplos extremos:

  • nos podemos encontrar con servidores físicos dando servicio a una sola máquina virtual cada uno,
  • o por citar el otro extremo máquinas sobre-cargadas, de pobre rendimiento y que pueden provocar un exceso de consumo que, junto con otras en el mismo rack, superen las capacidades energéticas, eléctricas y/o de disipación de calor del mismo y conduzcan a costes de servicio por problemas eléctricos o caloríficos.

Por otra parte, en segundo lugar, los DC suelen ser diseñados con márgenes de seguridad y de capacidad de crecimiento que provoca que exista energía desaprovechada y malgastada. Por tanto es importante disponer de herramientas o métodos  que permitan identificarla y reducirla: suprimir la “energía desaprovechada” en el D.C. (por error en los cálculos o por un desajuste evolutivo), reducir el valor de la “energía ociosa” (la disponible para absorber la fluctuación de la cargas dinámicas del D.C.), ajustar mejor la “energía de reserva”, aquilatando el “margen de seguridad, etc.

Pero, lógicamente, la reducción de la energía de “reserva” y de la de “seguridad” incrementa el riesgo de desaprovisionamiento en determinadas circunstancias imprevistas.

Por otra parte, en tercer lugar, para mejorar la Eficiencia Energética de un Data Center (es decir aumentar el DCiE o disminuir el PUE), se debe:

  • disminuir el consumo energético de cualquier origen (eléctrico, gas, gasoil, etc.) de todas las instalaciones o equipos que dan servicio al DataCenter pero que no están en la categoría de TIC (climatizadores, ventiladores, etc.)
  • disminuir las ineficiencias y pérdidas que se producen en los mismos (SAIs, grupos electrógenos de backup, etc.)
  • y reducir las pérdidas en la distribución de la energía (PDUs, cuadros eléctricos, cableado, etc.)

Pero, algunas de las medidas para la reducción de la energía no aprovechada en las TIC implican riesgos que se deben gestionar adecuadamente:

  • puede hacer peligrar la continuidad del servicio del DataCenter (p.e. la minoración de la capacidad total de los SAIs, o la reducción de las máquinas de A/C de reserva, etc.)
  • o pueden reducir la vida media de los equipos (p.e. al elevar la temperatura media del DataCenter para reducir la refrigeración)
  • o pueden hacer peligrar la buena gestión del DataCenter al eliminar elementos como PDUS, etc.
  • etc.

La resolución de estos 3 problemas enumerados (solo una muestra del conjunto de la problemática), se puede conseguir mediante la correcta implementación de  un  completo “proceso de gestión de la capacidad” (tal como lo  define la norma ISO 20.000 o las mejores prácticas ITIL)  que permita optimizar el uso de los recursos energéticos existentes en un DC, sin poner en peligro ni la disponibilidad del servicio ni los niveles de servicio comprometidos (SLA). Es decir gestionar la capacidad energética controlando el riego derivado.

Para ello proponemos la implantación de un sistema DCIM (Data Centre Infrastructures Management) mediante  el desarrollo procesos (bien automáticos, bien manuales donde no sea posible otra opción) que permitan integrar las Instalaciones (equipamiento no-TIC) con el equipamiento TIC y orquestar las operaciones de ambos, de forma que las Instalaciones se aquilaten en todo momento a la demanda de las TIC (sin exceso innecesario que suponga derroche energético, ni defecto que ponga en juego la disponibilidad de las TIC) y con el dinamismo que precisa un DC moderno.

DCIM como Agregador de Inteligencia Operativa

Estos procedimientos seguirán en la parte TIC el modelo de proceso de la norma ISO-20.000 y en la parte de Instalaciones la PAS-55, incorporando procesos que armonizcen la operacion de las Instalaciones con la operacion de las TIC.

Procesos de soporte a DCIM

Procesos de soporte a DCIM

Nota: Esto es un resumen de la ponencia de Tissat en el Concreso CSTIC 2012 que, con el lema “Dominando los riesgos se compite mejor”, ha sido organizado por la AEC (Asociación Española para la Calidad) y se ha celebrado en Madrid el pasado 18 de septiembre de 2012.