Azure Native Qumulo ahora disponible en la UE, el Reino Unido y Canadá: Más información

Atributos de un sistema moderno de almacenamiento de archivos

Escrito por:

Hace aproximadamente dos décadas, varias empresas desarrollaron un sistema de almacenamiento de archivos distribuido y paralelo. El ímpetu fue que, cuando los datos comenzaron a crecer exponencialmente, quedó claro que el almacenamiento escalable era el paradigma a seguir para grandes conjuntos de datos. WAFL, IBM Spectrum Scale (también conocido como GPFS), Lustre, ZFS y OneFS son ejemplos de sistemas de almacenamiento de archivos escalables. Todos estos sistemas tienen algo en común: tuvieron su "primer arranque" alrededor del año 2000. También todos tienen sus fortalezas y debilidades. Algunos de estos sistemas no son realmente escalables; otros son difíciles de instalar y operar; algunos requieren hardware especial o no son compatibles con los protocolos NAS habituales; pueden tener límites de escalabilidad o falta de velocidad de innovación.

El hecho de que estos sistemas de almacenamiento hayan sido diseñados hace 20 años es un problema. Muchas tendencias importantes de la tecnología de Internet, como DevOpsBig Data, infraestructura convergente, contenedores, IoT o todo lo virtual se inventaron mucho más tarde que 2000, por lo que estos sistemas de almacenamiento de archivos ahora se usan en situaciones para las que nunca se diseñaron. Claramente es hora de un nuevo enfoque para el almacenamiento de archivos.

RELACIONADO: Almacenamiento de bloques, almacenamiento de objetos y almacenamiento de archivos: ¿cuál es la diferencia?

Qumulo fue diseñado por varios de los mismos ingenieros que construyeron y crearon almacenamiento de escalamiento horizontal hace aproximadamente 15 años (Isilon), y obviamente, sus experiencias los llevaron a una solución muy moderna y flexible.

El moderno sistema de almacenamiento de archivos es independiente del hardware

Varios proveedores de almacenamiento de datos afirman que su producto es independiente de los requisitos específicos del hardware. Es posible que hayan utilizado el término "definido por software". Dos cualidades de un producto definido por software son:

  1. Independiente de cualquier dependencia específica de hardware
  2. Programable extensible

Qumulo cumple con ambos requisitos admirablemente. Puede ejecutar Qumulo en el hardware estándar proporcionado por Qumulo, en Servidores HPE Apollo 4200, y en AWS. Para fines de desarrollo y prueba, Qumulo ofrece un paquete gratuito de OVA para que pueda ejecutar un clúster completamente funcional en VMware Workstation o Fusion. También puede ejecutar una instancia independiente de Qumulo, con 5TB de almacenamiento, en AWS de forma gratuita. Usted solo paga por la infraestructura de AWS.

Debido a que Qumulo se puede administrar completamente a través de una API, es completamente extensible y se puede integrar en cualquier entorno operativo.

El moderno sistema de almacenamiento de archivos se ejecuta en el espacio de usuario

El sistema operativo Qumulo está construido sobre Ubuntu. Los desarrolladores de Qumulo pueden aprovechar todas las capacidades del ecosistema de Linux.

Los procesos del sistema de almacenamiento de archivos Qumulo se ejecutan en el espacio de usuario de Linux en lugar de en el espacio del kernel, lo que tiene una serie de ventajas:

  • Qumulo tiene sus propias implementaciones de protocolos como SMB, NFS y LDAP, que son independientes del sistema operativo subyacente. Por ejemplo, NFS se ejecuta como un servicio con sus propias notaciones de usuarios / grupos. Esto hace que Qumulo sea más portátil.
  • El modo Kernel es principalmente para controladores de dispositivos que funcionan con hardware específico. Al operar en el espacio de usuario, Qumulo refuerza su independencia de hardware. Puede ejecutarse en una amplia variedad de configuraciones y entornos.
  • Ejecutar en el espacio del usuario significa que Qumulo puede desarrollar y ofrecer funciones a un ritmo mucho más rápido.
  • La ejecución en el espacio de usuario mejora la confiabilidad de Qumulo. Como un proceso de espacio de usuario independiente, Qumulo está aislado de otros componentes del sistema que podrían introducir daños en la memoria, y los procesos de desarrollo de Qumulo pueden hacer uso de herramientas avanzadas de verificación de memoria que permiten detectar errores de codificación relacionados con la memoria antes de la versión del software. Al utilizar una estrategia de doble partición para las actualizaciones de software, Qumulo puede actualizar automáticamente tanto el sistema operativo como el software de Qumulo para obtener actualizaciones rápidas y confiables. Puede reiniciar fácilmente Qumulo sin tener que reiniciar el sistema operativo, el nodo o el clúster.

API interactiva, análisis en tiempo real y cuotas.

Qumulo es extensible programáticamente. Tiene una API completa, que puede ampliarse e integrarse en cualquier entorno de centro de datos.

Si lo desea, puede utilizar la API como interfaz principal para todas sus tareas de administración y operación. Sin embargo, para mayor comodidad, también hay una interfaz de usuario web y una CLI disponibles. Tanto la IU como la CLI usan la misma API que cualquiera puede usar para interactuar con Qumulo. La API y los enlaces de Python son documentado y disponible en GitHub. Lo mismo es cierto para el envoltura de línea de comando, qq.

Una de las cosas más inteligentes en Qumulo es su capacidad de análisis en tiempo real. Los metadatos, como los bytes utilizados y los recuentos de archivos, se agregan cuando se crean o modifican los archivos y directorios, lo que significa que la información está disponible para su procesamiento oportuno sin costosas caminatas en el árbol del sistema de almacenamiento de archivos.

La interfaz de usuario web incluye un gran número de tableros de instrumentos y gráficos en tiempo real, como puntos de acceso de IO y puntos de acceso de rendimiento, y todos los datos se pueden recuperar a través de la API bien documentada si también desea procesarlos con otras herramientas.

Artículos Relacionados

Ir al Inicio