No es fácil.
Nada fácil.
Y no tiene pinta de que vaya a ir a mejor.
Más bien al contrario.
De hecho, hay días que me planteo el porqué seguir con toda esta movida.
"Con lo a gusto que estaba yo con mis plantitas".
...
A ver, esta última semana ha sido dura, como preveía en la última newsletter.
Si te dedicas a algo relacionado con la IT seguramente sepas de qué te hablo, pero si tocas algún tema de ciberseguridad me vas a captar rápido.
No hace mucho hablaba de la cantidad de estrés que acumulas cuando te dedicas a este negocio, pero no sabía (o sí...) que todo puede empeorar, como el coche de Fernando Alonso con sus "peoras", y que cuando crees que has llegado al límite de movidas, pueden llegar otras nuevas.
A pesar de que en los vídeos corporativos eso de tener un sitio lleno de grandes pantallas y un cartel de "Security Operations Center" en la puerta, pueda parecer algo supervistoso, la realidad es mucho menos amigable.
El día a día, al final, consiste en gestionar las 1000 alertas que surgen de los agentes instalados en los endpoints, las cosas raras que ves en los logs y las movidas que saltan sin esperarlo gracias a la Capa 8.
Y el gestionar esto no es demasiado difícil, o sea, a veces puede ser tedioso y tal, pero es administrar un sistema de una manera o de otra.
¡Y eso nos gusta!
Lo malo es la burocracia de detrás.
El rellenar mil informes de lo acontecido en el día a día, mil registros y dar mil explicaciones.
Eso cansa.
Y no va a ir a mejor.
Porque ya nos encargamos (¡se encargan!) de irnos añadiendo novedades burocráticas a nuestro trabajo.
En España, por ejemplo, una vez que el ENS (Esquema Nacional de Seguridad) esté implantado en "casi" todas las empresas españolas que, de una manera o de otra, trabajen con la administración pública, la cosa se va a complicar más.
Te va a dar igual que trabajes para un pequeño ayuntamiento que para el Ministerio de Hacienda, te va a tocar pasar por la burocracia sin sentido de estas cosas.
A ver, que algún sentido sí que tiene (poco...), pero es un coñazo supino y genera una pérdida de tiempo brutal.
De hecho, el otro día hablaba con un compañero, de que al final tendrá que haber en cada empresa un departamento solo dedicado a estas cosas, a lo que llaman "Compliance".
Ya no va a ser cosa solo de empresas grandes, las pequeñas van a tener que pasar por el aro sí o sí.
O bien subcontratarlo a otra empresa llena de gente sin alma que sea capaz de dedicarle horas y horas a rellenar informes, registros y movidas.
Y no he dicho "una persona", sino "un departamento", porque la cosa se complica en cuanto escarbas un poquito. ¡Te lo aseguro!
Todos los que estáis inmersos en este tipo de cosas fijo que me comprendéis. ¡Cuando crees que has acabado te faltan mil cosas más!
¡Y nosotros somos tíos de acción! ¿Que es eso de rellenar informes? ¿Es que hemos estudiado derecho o qué?
Pero nada, al final te toca pasar por el aro y rellenar cositas, automatizar otras e intentar que toda esa movida no te acabe cayendo encima como una gran losa.
O sea que calculo que en breve, en esos "cursos de iniciación" que se dan en todas las empresas, además de la protección de datos, los riesgos laborales, la igualdad de género y las "cosas corporativas", tocará dar una "iniciación al ENS", si no al tiempo.
¡Además, tendremos a su correspondiente responsable departamental de cada uno de esos items por cierto! ¡Qué grandioso!
Pero nada, seguiremos haciéndonos todos más competitivos y más mejores. Cada registro que relleno siento cómo la competitividad mejora en mi empresa.
¡Es como cuando llega el cambio de hora y a las 5 de la tarde cuando enciendo la luz ya noto el ahorro! ¡Que me gusta ahorrar!
¡Estoy deseando que inventen otra cosa de estas! ¡No sé a quién dar las gracias por estas tareas caídas del cielo!
¡Feliz Domingo libre de rellenar registros y papeles varios!
Cloudflare se ha caído esta semana. 😵😵😵
Y no ha sido una pequeña caída, ha sido una hostia enorme.
Todo empezó cuando la API dejó de funcionar, el panel no funcionaba tampoco, algunos servicios no respondían...
Y al entrar en https://cloudflarestatus.com te encontrabas algo así:
"Bueno, les está fallando algo del panel y la API, se arreglará pronto..." pensamos todos...
Pero unas horas después, la cosa no pintaba como de ir a mejor... 😐😐😐
Ahora ya los servicios impactados eran varios, la DNS y el CDN seguían funcionando (¡¡¡MENOS MAL!!!), pero algunas reglas no iban, los balanceadores de carga funcionaban, pero no podías pararlos, los workers exactamente iguales.
La cosa se ponía sería...
Y claro, por ejemplo, te hace una gracia tremenda tener servicios funcionando, que te cobran por hora y que no puedes parar...
La cosa siguió avanzando... Y ya me estaba empezando a joder el tema, porque tenía varios servicios que poner en marcha para los que tuve que buscar "plan B".
Mientras tanto, CloudFlare seguía informando y por fin dio pistas de qué estaba pasando:
¿Fallo de energía en varios datacenters o qué? ¿Pero cómo puede ser eso?
¿Tiene Cloudflare todo su backplane en solo una zona geográfica? ¿Una empresa que cuenta con presencia en multitud de sitios?
Según leímos en reddit todo parecía provenir de los datacenters que la empresa tiene en Oregón.
Rápidamente, los putos zumbados del Telegram nos pusimos a hacer OSINT de cortes de luz en Oregón, noticias en periódicos y no encontramos nada de nada.
6 horas después, la empresa anunciaba que por fin tenían energía (parcialmente) en los DCs y que estaban empezando a recuperar servicios...
Pero no... 😶😶😶
La cosa se fue alargando y llegamos a la mañana del viernes con la casa manga por hombro...
Y la mañana siguió avanzando...
Y los comunicados eran los mismos, pero solo cambiando la hora...
Total que los servicios quedaron completamente restablecidos a partir del 4 de noviembre a las 04:25 UTC.
¡Más de 36 horas de incidente!
¿PERO QUÉ PASÓ?
Pues nada, al rato, el propio CEO de Cloudflare lanzó el postmortem del incidente en el que básicamente explica que:
Un texto claro, conciso y explicito en el que indican todo lo que falló y como van a remediarlo.
Y como soy un ansias, al rato hice mi "postmortem del postmortem" en twitter:
¡Y hasta aquí el incidente de Cloudflare! ¡O no! ¡Veremos!
¡Nosotros somos los importantes! ¡No el tío que desarrolla el software! ¡Sin nosotros no son nada! ¡A pesar de que no pagamos un duro!