IT-admin-are-fixing-windows-recovery-problem-blue-screen

Cómo los administradores de TI están combatiendo la Pantalla Azul de la Muerte en Windows

July 19, 20244 min read

En un escenario que parece sacado de una película de ciencia ficción, administradores de TI en todo el mundo se encuentran en una carrera contra el tiempo. Su misión: resolver una crisis informática masiva que ha dejado miles de computadoras y servidores fuera de servicio debido a la temida Pantalla Azul de la Muerte (BSOD) en Windows. El culpable: una actualización defectuosa del proveedor de ciberseguridad CrowdStrike.

La magnitud del problema

Sectores críticos afectados

Esta crisis no discrimina. Desde bancos hasta aerolíneas, pasando por supermercados y emisoras de televisión, organizaciones de todos los sectores se han visto afectadas. La escala del problema es verdaderamente global, poniendo a prueba la resiliencia de la infraestructura digital en la que tanto confiamos.

CrowdStrike: De protector a problema

CrowdStrike, una empresa reconocida por proporcionar soluciones de seguridad de vanguardia, se encuentra ahora en el ojo del huracán. Una actualización fallida de su software de protección ha desencadenado una reacción en cadena de fallos en sistemas Windows en todo el mundo.

Las soluciones emergentes

El método del "reinicio persistente"

Uno de los enfoques que está ganando tracción entre los administradores de TI es sorprendentemente simple: reiniciar repetidamente los sistemas afectados. Esta táctica se basa en la esperanza de que, en algún momento durante el proceso de arranque, la máquina logre descargar la actualización correctiva de CrowdStrike antes de que el controlador defectuoso cause el temido BSOD.

El procedimiento de emergencia

Para aquellos casos donde el reinicio no es suficiente, CrowdStrike ha proporcionado un procedimiento más invasivo:

  1. Arrancar Windows en Modo Seguro o en el Entorno de Recuperación de Windows.

  2. Navegar hasta el directorio C:\Windows\System32\drivers\CrowdStrike.

  3. Localizar y eliminar el archivo que coincida con "C-00000291*.sys".

  4. Reiniciar el equipo.

Este método requiere acceso físico a las máquinas afectadas y, en algunos casos, puede complicarse debido a:

  • Cifrado de disco (como BitLocker).

  • Falta de permisos de administrador para eliminar el controlador defectuoso.

Restauración de máquinas virtuales

Las empresas que utilizan escritorios virtuales tienen una ventaja en esta crisis. Pueden restaurar los hosts afectados a un punto anterior a la actualización problemática de CrowdStrike, ofreciendo una solución más rápida en comparación con otros entornos.

Desafíos y consideraciones

Acceso remoto: Un obstáculo adicional

En la era del trabajo remoto, muchos administradores de TI se enfrentan a un desafío adicional: no tienen acceso físico a las máquinas afectadas. Esto complica significativamente la aplicación de soluciones manuales como el arranque en Modo Seguro.

Sobrecarga de los servidores de actualización

La ironía de la situación es palpable. Los servidores de actualización de CrowdStrike están experimentando una sobrecarga masiva debido a los millones de máquinas que intentan desesperadamente obtener la actualización correctiva. Esta congestión está ralentizando el proceso de recuperación para muchas organizaciones.

Lecciones por aprender

La importancia de los protocolos de seguridad

Este incidente subraya la crucial importancia de contar con protocolos de seguridad robustos para el despliegue de actualizaciones, especialmente en software que opera a nivel de kernel. La pregunta que resuena en la comunidad de TI es: ¿Cómo pudo una actualización tan crítica llegar a tantos sistemas sin las debidas comprobaciones?

Planificación de contingencias

La crisis actual está obligando a muchas organizaciones a reexaminar sus planes de contingencia para fallos de TI a gran escala. La capacidad de responder rápida y eficazmente a este tipo de eventos se ha convertido en una necesidad imperativa en nuestro mundo hiperconectado.

La respuesta de CrowdStrike

George Kurtz, CEO de CrowdStrike, ha salido al frente de la crisis. En una entrevista con NBC News, Kurtz ofreció disculpas por los daños causados y aseguró:

"Podría llevar algún tiempo para algunos sistemas que no se recuperarán automáticamente, pero nuestra misión es asegurarnos de que todos los clientes se recuperen completamente".

Esta declaración, aunque tranquilizadora, plantea interrogantes sobre los procesos de control de calidad y las pruebas de CrowdStrike antes de lanzar actualizaciones críticas.

El impacto a largo plazo

Confianza y reputación en juego

Este incidente no solo ha causado interrupciones operativas inmediatas, sino que también ha puesto en tela de juicio la confiabilidad de las soluciones de seguridad de alto nivel. CrowdStrike, y posiblemente otras empresas del sector, se enfrentarán a un escrutinio intensificado en los próximos meses.

Reevaluación de estrategias de seguridad

Es probable que muchas organizaciones reconsideren sus estrategias de seguridad cibernética. Esto podría llevar a:

  • Una mayor diversificación de proveedores de seguridad.

  • Implementación de capas adicionales de verificación antes de aplicar actualizaciones críticas.

  • Fortalecimiento de los planes de continuidad del negocio y recuperación ante desastres.

Un despertar tecnológico colectivo

Por lo tanto, este incidente sirve como un severo recordatorio de la fragilidad de nuestros sistemas interconectados. Mientras los administradores de TI continúan luchando para restaurar la normalidad, la industria tecnológica en su conjunto está recibiendo una lección crucial sobre la importancia de la prudencia, la planificación y la preparación en el mundo de la ciberseguridad.

La crisis actual no solo destaca la necesidad de mejores prácticas en el despliegue de actualizaciones de software crítico, sino que también subraya la importancia de la resiliencia y la adaptabilidad en nuestras infraestructuras digitales. A medida que avanzamos, es evidente que la colaboración entre proveedores de tecnología, expertos en seguridad y profesionales de TI será más crucial que nunca para prevenir y mitigar crisis similares en el futuro.

Fuente: The Verge

Back to Blog