8 ago 2011

Tormentas en la Nube

Como veis, soy un tío con mucha chispa para los nombres de las entradas. Fuera de bromas, me gustaría analizar un poco lo que ha pasado con Amazon y dar mi opinión al respecto, ya que el Cloud Computing fue el tema de mi proyecto de fin de carrera, así que algo he leído sobre el tema ;)

¿Qué ha pasado?

Por si no te has enterado, o estas leyendo esta entrada en un futuro lejano a los incidentes de ayer, te comento el incidente. Ayer domingo 7 de Agosto de 2011, a las 20.00h, el servicio de Cloud Computing que Amazon ofrece en sus servidores de Dublín sufrió una interrupción total del funcionamiento de todos su servicios.

El motivo, al parecer, fue la caída de un rayo que provocó el corte del suministro eléctrico y la descarga afectó del sistema de control de emergencia que tendría que haber activado los generadores suplementarios. La caída total duró unas tres horas, mientras se sincronizaban los generadores manualmente.

Esto ha desembocado en que miles de páginas y servicios web de Europa hayan estado inaccesibles durante unas horas en algunos casos y en otros ya llevan un día como en Menéame.

Este incidente ha dado lugar a que muchos se hayan lanzado a criticar a machete este modelo y poco más que declarando que el apocalipsis está al llegar si se sigue utilizando esta diabólica tecnología.

¿Qué es el Cloud Computing?

Para empezar, el Cloud Computing no es una tecnología, es un modelo de negocio. Aclaro esto porque muchos oímos hablar de "la nube esto" o "la nube lo otro" como si fuese alguna tecnología como los móviles o las pantallas planas LCD.

Lo que ofrece el Cloud Computing como modelo es un servicio, en lugar de un producto. Es decir, en lugar de comprarme una aplicación con una clave y un cd que instalo en mi maquina, aquí compro una suscripción mensual a la aplicación y las cosas las instalas en remoto, en la nube.

Y cuando digo en la nube me refiero a que se instala en las megagranjas de servidores que ofrece Amazon, Google o el proveedor de turno.


¿Qué ventajas trae esto?

La primera de todas es que yo sólo pago por lo que uso. Que uso veinte, pago veinte; que uso tres, pago tres; y además lo bueno de estos servicios es su capacidad de escalar las necesidades, es decir, si tengo una tienda online, es probable que en período de Navidades el número de clientes se me dispare y sin embargo en verano en pleno periodo vacacional no venda nada. En el modelo tradicional tendría que encontrar un punto de compromiso entre verano-navidades para calcular los recursos estáticos (que no varían en el tiempo) que contrataría. Con la nube gano flexibilidad, sólo contrato lo que necesito, ni más ni menos.

Otra ventaja está en las pequeñas empresas o con menos recursos, que simplemente no puede permitirse comprar y montar un centro de datos con sus instalaciones físicas, con la nube no necesitas una inversión tan grande. Además, no necesitas contratar personal que lo mantenga, pues en principio con la nube será el que se encargue de ello.

Y por destacar otra ventaja más y no alargarlo mucho, con la nube tienes accesibilidad remota estes donde estes, ya que para ti es un sistema descentralizado y con un mero navegador puedes acceder desde cualquier lugar del mundo en cualquier momento.

Principales problemas

El principal problema que tiene este modelo es que estás delegando responsabilidades y cuando delegas, dependes de lo bien que lo haga el otro, y parece que en este caso no lo han hecho muy bien.

Por otro lado, el modelo de Cloud Computing no ofrece a penas nuevos riesgos con respecto a cualquier otro servicio online, porque al final del todo, no deja de ser un servicio web con almacenamiento y proceso de datos, vamos, un servidor de toda la vida.

El problema viene en que si un servicio es atacado o sufre algun percance sólo se ve afectado ese servicio, pero en el caso de la nube, si una nube es atacada o sufre un percance, muchos servicios pueden verse afectados, como ha sido el caso.

Errores de Amazon

Lo que no puede volver a ocurrir es lo que ha sucedido en este caso, ya que más que un problema del modelo o la arquitectura usada, ha sido un problema de la gestión de la seguridad informática.



Cuando se habla de seguridad informática, mucha gente piensa en virus, firewalls y demás software informático, pero también forma parte de este campo el estudio de la seguridad física, de las amenazas y vulnerabilidades que un sistema puede tener más allá del software. En mi caso, este tipo de posibles incidentes los he estudiado en la carrera y hay que tenerlos en cuenta a la hora de diseñar un sistema de información. Existen múltiples normativas, como la familia ISO27000 que recogen una serie de pasos y consejos a seguir a la hora de diseñar un sistema informático, desde el punto de vista de la gestión de la seguridad de la información.

En el caso de Amazon, no puede ser que un rayo haga caer todo tu servicio en Europa durante más de un día. Lo primero porque deberían haber sido más rápidos en reactivar la corriente con los generadores, y en cualquier caso, creo que deberían de disponer de algun sistema de emergencia de replicación de datos que permita trabajar a esa nube desde otra localización, bien sea con una copia reciente de los datos o una replicación en tiempo real. Lo que no puede ser es que centralices una nube sin ningún tipo de servicio de réplica (otro data center), que no tiene porque estar operativo en todo momento, pero sí ser activable en caso de una caída general como esta.

 Imagino que, como mínimo, ahora tendrán un centro de datos en Dublín, otro en América y otro en Asia (por tener controladas todas las zonas horarias). No sería descabellado tener un cuarto centro listo para casos de emergencia como este. Porque no dudo que tuvieran copias de seguridad de escasos minutos antes de que cayera el caso, pero de nada me sirve tener una copia de mis datos si no tengo donde usarlos.

Por otro lado, la lentitud de toda la restauración está siendo extremadamente lenta, es inadmisible que con lo importante que es el tiempo hoy en día, que se llegan a ofrecer servicios con menos de un minuto de fallo al año, se tarden más de 24 horas en restaurar un servicio.

Consejos para las empresas

Uno de los errores que seguro han cometido más de una empresa es no tener otra alternativa a este servicio, es decir, que han confiado demasiado en un único proveedor. Si bien puede resultar muy caro tener dos proveedores al mismo tiempo, el no tener capacidad de reacción puede salir también muy caro.

En seguridad hay que llegar a alcanzar un punto de equilibrio entre lo que puedes perder en caso de que ocurra un incidente y el coste de paliar o evitarlo, y no siempre es fácil, pero hay que tener en cuenta que estas cosas pasan. Para esto existen las auditorías de seguridad, los análisis de riesgo y demás estudios que permiten evaluar y tomar decisiones sobre estas materias.

En conclusión

Ahora vais a ver en todos los medios que acusan de todos los males al Cloud Computing, llamandolo moda, olvidandose de que esto mismo podía haber sucedido a cualquier otro servicio.

Desde mi punto de vista creo que se equivocan, porque no es el futuro, es el presente, porque este tipo de servicios lo usamos todos los días: Google, Youtube, Spotify, Google Docs, Gmail, Dropbox etc etc Y la tendencia es que sigan creciendo, pues como ya he comentado, por costes sales beneficiado con el Cloud Computing y los riesgos que entraña son los mismos de siempre, depende de su gestión.

Porque eso sí, todo depende de como se gestionen las cosas y aquí Amazon la ha fastidiado bien.

No hay comentarios:

Publicar un comentario

Related Posts Plugin for WordPress, Blogger...