Existe una mejor manera de actualizar el software de infraestructura

Esta es la tercera parte de una serie de blogs de cinco partes que analizará más de cerca nuestro nuevo conjunto de servicios de datos que ayudará a nuestros clientes a simplificar radicalmente la gestión de datos de archivos a escala. Hemos hablado de Rendimiento en caché de NVMe y Escala dinámica de Qumulo en publicaciones anteriores. Aquí, proporcionamos una descripción general de Qumulo Instant Upgrade. Los blogs futuros de esta serie profundizarán en los otros nuevos servicios de datos incluidos en este anuncio.

Qumulo Instant Upgrade automatiza las actualizaciones de software, lo que facilita el acceso a las últimas funciones, mejoras de seguridad y rendimiento.

Los administradores de TI históricamente han temido el proceso de planificación y realización de actualizaciones, sin mencionar la implementación de planes de reversión en caso de falla. Sin embargo, la actualización es necesaria para aprovechar las nuevas funciones, las nuevas mejoras de rendimiento y para mantener la seguridad del sistema contra las últimas amenazas de ciberseguridad.

El problema: una elección entre disrupción y tiempo

Las estrategias de actualización para los sistemas de infraestructura de escalamiento horizontal se han dividido históricamente en dos campos:

  1. Actualización progresiva - un solo nodo se desconecta, actualiza, vuelve a estar en línea y luego la actualización pasa al siguiente nodo. El tiempo total para actualizar un sistema crece linealmente con el tamaño del sistema. Las actualizaciones continuas pueden tardar horas, si no días, en completarse en grupos muy grandes. Y, si hay una falla en la actualización de algunos de los nodos en el proceso, se necesita un plan de reversión para volver a la configuración original. Esto requiere mucho tiempo y es muy riesgoso para la integridad del sistema y para permanecer dentro de una ventana de mantenimiento si se necesita una reversión.
  2. Actualización simultánea - todos los nodos de almacenamiento se actualizan al mismo tiempo.
    Por lo general, esto requiere tiempo de inactividad del sistema y los propietarios de las aplicaciones deben planificar pausar sus aplicaciones y luego volver a ponerlas en línea después de que el sistema vuelva a estar en línea. Si hay una falla en la actualización de cualquier nodo en el proceso, el tiempo de inactividad de la aplicación se extiende a medida que los administradores realizan el engorroso proceso de revertir la actualización en otros nodos, luego realizan verificaciones de que todo haya regresado correctamente al estado original y funcione correctamente .

Un mejor enfoque: actualización instantánea

Qumulo cree que debe pasar los fines de semana haciendo las cosas que disfruta. Durante los últimos ocho años, Qumulo ha estado en un viaje para simplificar la gestión de datos no estructurados. Al comienzo de ese viaje, sabíamos que realizar actualizaciones de forma rápida y sencilla sería una promesa fundamental para nuestros usuarios, por lo que elegimos una arquitectura de software en la que Qumulo Core se ejecuta en el espacio de usuario por encima de Linux.

Este enfoque nos brinda la flexibilidad de una aplicación; sin embargo, aprovechar esa flexibilidad requirió implementar una innovación fundamental en nuestro producto: la contenerización. Durante los últimos seis meses, reinventamos la forma en que empaquetamos nuestro sistema de archivos y los más de 25 servicios en los que confiamos en un solo contenedor de tiempo de ejecución. Con este cambio, nuestros clientes ahora pueden actualizar cuatro nodos o 100 nodos con el mismo proceso de actualización con un solo botón y actualizar todo su clúster en solo 20 segundos de interrupción percibida para los usuarios finales.

Al diseñar nuestra solución de actualización instantánea, aprovechamos las ventajas únicas de que Qumulo es un sistema de archivos completamente en contenedores definido por software. Empaquetamos todo el software y los servicios de datos de Qumulo en un único contenedor definido por software que reside en cada nodo dentro de un clúster de producción. Cuando comienza la actualización instantánea, se crea un segundo contenedor con la versión más reciente de Qumulo Core y se pone en línea en paralelo con la versión de software anterior que permanece en línea y en producción. Una vez que la nueva versión se está ejecutando y validada, los procesos activos de la versión anterior de Qumulo Core se mueven sin problemas a la nueva versión que se ejecuta en el nuevo contenedor (consulte la Figura 1). Posteriormente se retira el recipiente viejo.

La actualización instantánea a Qumulo Core es:

  • Sencillo - Inicie la actualización de un clúster de cualquier tamaño con solo presionar un botón
  • Rápido - La actualización de un clúster de cualquier tamaño se completa con solo 20 segundos sin conexión
  • Confiable - No es necesario planificar el tiempo de inactividad de la aplicación, sin un impacto notable en el rendimiento

Cuando el sistema operativo del host subyacente o los controladores necesitan actualizarse, Instant Upgrade también automatiza este proceso e iniciará un reinicio automáticamente.

Figura 1: Actualización instantánea de Qumulo

¿Por qué Qumulo tiene la capacidad única de ofrecer la experiencia de actualización instantánea?

La actualización instantánea es posible porque Qumulo se ejecuta como una aplicación de "espacio de usuario" por encima de Linux. Otros sistemas de archivos se ejecutan en el "espacio del kernel", habiendo realizado personalizaciones profundas y construido dependencias en kernels específicos del sistema operativo. Debido a que Qumulo es una aplicación de espacio de usuario, podemos ponerla en contenedor, lo que a su vez nos permite actualizar el contenedor activo de una versión a otra mientras dejamos el sistema operativo y el kernel en ejecución.

Otros sistemas de archivos normalmente requieren un proceso de actualización independiente para los diferentes componentes del sistema de archivos, servidores de metadatos, puertas de enlace NAS, análisis de datos e IU y servidores de almacenamiento subyacentes. Estos diversos componentes a menudo se encuentran en programas de lanzamiento separados y deben actualizarse en diferentes momentos durante el año.

Innovar en nombre de nuestros clientes

Todo este proceso no fue una simple hazaña de ingeniería, sino una verdadera recompensa para los usuarios que buscan dedicar su tiempo al trabajo estratégico o al tiempo con su familia y amigos, en lugar de las tediosas tareas de administración del sistema. Ahora, todo el clúster, el sistema operativo, los controladores y los servicios se actualizan con solo presionar un botón, durante el día hábil estándar.

Si bien comenzamos este proyecto de software a principios de este año, realmente comenzamos este viaje hace ocho años cuando Neal Fachan y el resto de nuestro equipo fundador imaginaron un futuro en el que el software priorizaba y tomaron decisiones arquitectónicas para habilitar esa realidad. Ningún cliente nos pidió "ejecutar en el espacio del usuario", pero sabíamos que sería fundamental para desbloquear la innovación futura. Con el lanzamiento de Instant Upgrade, cumplimos con esas apuestas.

Más información

Encuentra mas sobre Noticias en la plataforma de datos de archivos de Qumulo y vea qué hace que el software de Qumulo sea único en este descripción general de la arquitectura del software.

Contáctanos para una demostración, y no olvide suscríbase a nuestro blog para obtener mejores prácticas y recursos más útiles.

.

Comparta este artículo