Codificación de borrado: más grande, más rápido, más fuerte

Nos complace anunciar una versión más grande, más rápida y más fuerte de Qumulo Core. El espíritu de estas palabras se ha utilizado para describir todo, desde nuestros equipos olímpicos hasta Steve Austin en "The Six Million Dollar Man". Al igual que The Six Million Dollar Man, que se sometió a una cirugía para reemplazar componentes normales por componentes biónicos, hemos reemplazado un componente funcional por uno mejor construido con tecnología de punta. ¡Qué biónica fue para el Sr. Austin, la codificación de borrado es para Qumulo!

La protección de codificación de borrado es un gran avance para Qumulo Core. Los administradores de almacenamiento y los usuarios experimentarán poca o ninguna diferencia en la forma en que interactúa con un clúster Qumulo. Pero al igual que Steve Austin parecía un ser humano normal pero no estaba, dentro del código, se han realizado cambios importantes. El poder de la codificación de borrado está en la forma en que protege los datos en su clúster y le permite utilizar el espacio de clúster de manera más eficiente.

La codificación de borrado aumenta la protección

La codificación de borrado aumenta su protección contra la inevitabilidad de que fallen las unidades de disco. Si dos unidades fallan al mismo tiempo en su clúster, no hay problema. Se garantiza que sus datos están seguros. Al combinar la protección mejorada de la codificación de borrado con los tiempos de reprotección de unidades más rápidos de la industria, Qumulo puede construir clústeres en tamaños mucho más grandes que los que se usan en la actualidad.

Para lograr esto, Qumulo Core crea 6 bloques para cada dato escrito en el clúster. Cuatro de esos bloques contienen los datos en sí separados en partes del mismo tamaño y dos bloques de paridad que se utilizan únicamente para recrear datos que pueden perderse debido a una falla en la unidad. Usando Reed-Solomon para administrar las matemáticas requeridas, Qumulo Core recrea cualquier pieza de datos perdida usando cuatro de los bloques restantes. No importa cuáles cuatro, siempre que haya cuatro. Debido a que explícitamente nunca colocamos ninguno de los 6 bloques en la misma unidad, podemos perder 2 unidades y tener la garantía de tener al menos 4 bloques restantes. A continuación, se muestra un ejemplo de cómo la codificación de borrado usa la paridad para proteger los datos contra 2 fallas simultáneas de unidades:

En este ejemplo, las cuatro partes del archivo tienen una longitud de 4 bytes. Cada pieza es una fila de la matriz. El primero es “ABCD”. El segundo es “EFGH”. Y así.

El algoritmo de Reed-Solomon crea una matriz de codificación que usted multiplica con su matriz de datos para crear los datos codificados. La matriz se configura de modo que las primeras cuatro filas del resultado sean las mismas que las primeras cuatro filas de la entrada. Eso significa que los datos se dejan intactos, y todo lo que realmente está haciendo es calcular la paridad.

¡Pierdes unidades 2!

La aplicación de la matriz inversa deja los datos en este estado, lo que deja la ecuación para reconstruir los datos originales de las piezas disponibles:

Ahora, aplique álgebra simple.

Voila! Sus datos han sido reconstruidos a partir de un fallo de la unidad 2

La codificación de borrado le permite utilizar más espacio

La codificación de borrado le permite utilizar más espacio de disco sin procesar para almacenar datos. La duplicación protege sus datos al hacer copias 2 de todo lo que se encuentra en su clúster. La mitad de tu espacio está dedicado a la protección. La codificación de eliminación de Qumulo utiliza 33% menos de espacio en disco. Con nuestra implementación inicial, solo un tercio de su espacio en bruto está dedicado a la protección, lo que le permite obtener hasta un 67 de eficiencia en sus unidades. En futuras versiones, el porcentaje de espacio utilizable será aún mayor.

En el futuro, ofreceremos opciones para esquemas de codificación adicionales que proporcionen aumentos significativos en la cantidad de espacio utilizable en el clúster mientras mantenemos la protección contra fallas en la unidad 2. La interfaz de usuario está ligeramente modificada para proporcionar una imagen más precisa del nivel de protección de su clúster. La página de información general del clúster ahora está dedicada a la protección de datos y ya no combina estos datos con la disponibilidad de datos (en el caso de que el clúster esté fuera de línea, sin riesgo para sus datos), ya que puede encontrar si un nodo se desconecta debido a una red o algún otro fallo no de disco.

Este primer lanzamiento no lo tiene todo. Todavía se está trabajando para mejorar nuestro rendimiento y la experiencia del usuario en un modo degradado (disco hacia abajo o nodo hacia abajo) y ciertas métricas de rendimiento que no son de lectura / escritura, como la velocidad de borrado, aún requieren trabajo.

La implementación de la codificación de borrado crea más resistencia contra las fallas de la unidad, permite tamaños de clúster masivos y hace que el espacio en bruto de su clúster sea más eficiente. En resumen, Qumulo Core es ahora más grande, más rápido y más fuerte.

Pruebe Qumulo gratis

Pruebe Qumulo gratis

Explore un entorno Qumulo completamente funcional, directamente en su navegador.

Prueba Demo

Comparta este artículo