Cuatro consideraciones al evaluar sistemas de archivos para su entorno informático de investigación en ciencias biológicas

Escrito por:

El mercado de la informática de investigación es más crítico ahora que nunca. Por ejemplo, la investigación sobre terapias con medicamentos tiene una gran demanda debido a la pandemia de COVID, y la investigación sobre genómica está mejorando rápidamente y está trayendo nuevos tratamientos y terapias al mercado más rápidamente.

Esta innovación se debe a la capacidad de las organizaciones de ciencias de la vida para procesar cantidades masivas de datos, al mismo tiempo que aprovechan tecnologías como la inteligencia artificial (IA) y el aprendizaje automático (ML). Las cargas de trabajo de la informática de investigación, como la secuenciación genómica, el análisis de datos y las imágenes de investigación, dependen increíblemente de su plataforma de gestión de datos.

Las organizaciones están gastando decenas de millones de dólares en sistemas y plataformas para capturar, procesar y almacenar muchos tipos de datos (por ejemplo, experimentales, operativos, clínicos) de muchas fuentes dispares. Además, los instrumentos crean datos complejos a partir de una amplia gama de dispositivos (secuenciadores genómicos, microscopios 3D, sistemas de imágenes de pacientes) que transmiten enormes cantidades de datos a sistemas centralizados para su análisis. Con la evolución continua de las tecnologías de imagenología AI, ML y 3D, el tamaño y la cantidad de datos que las organizaciones de ciencias biológicas deben administrar continuarán escalando mucho más allá de los petabytes.

Como resultado, muchas organizaciones están evaluando arquitecturas modernas para consolidar, procesar y aprovechar estos datos.

Las plataformas de datos de archivos tienen la capacidad de procesar grandes cantidades de datos para la informática de investigación, que a menudo consisten en miles de millones de archivos, para extrapolar información clave de investigación. Las innovaciones de IoT (Internet of Things) están ayudando a capturar estos puntos de datos a niveles récord.

Plataforma de datos de archivos de Qumulo 

Según Mundo Bio-IT, "Con la mayor demanda de potencia informática por parte de los investigadores y científicos de las ciencias biológicas que abordan problemas de macrodatos, el almacenamiento y la infraestructura deben poder escalar para manejar miles de millones de puntos de datos y archivos de manera eficiente"

Al evaluar una plataforma de datos de archivos para sus cargas de trabajo informáticas de investigación, debe considerar lo siguiente:

  • ¿Mi plataforma de datos de archivos ofrece un rendimiento de archivos pequeños con la misma eficacia que los archivos de transmisión grandes? Esto elimina las limitaciones de tamaño de "bloque" aplicadas con otros sistemas de archivos. Para mejorar el rendimiento, muchos sistemas de archivos utilizan tamaños de bloque más grandes, lo cual está bien para archivos grandes, pero muy ineficaz para archivos pequeños, ya que cada bloque solo puede contener un archivo. Esto potencialmente conduce a un enorme desperdicio de capacidad.

“Uno de nuestros principales criterios de reemplazo fue encontrar un sistema de almacenamiento que pudiera unir ese volumen y variedad de archivos”, dice Bill Kupiec, gerente de TI de Departamento de Embriología de Carnegie. “Tenía que manejar tanto la transmisión necesaria para conjuntos de datos muy grandes como el procesamiento rápido requerido para millones de archivos pequeños. Eso hizo que encontrar una solución viable fuera extremadamente desafiante.

“Nuestra organización de investigación se encuentra entre las grietas para la mayoría de los proveedores de almacenamiento, con conjuntos de imágenes gigantes y millones de pequeños fragmentos de secuenciación genética. Encontrar un sistema que manejara razonablemente todos nuestros complejos flujos de trabajo fue difícil, y al final solo Qumulo fue el adecuado ”.

  • ¿Puede mi organización escalar cargas de trabajo sin problemas, cuando sea necesario, a entornos de nube? Debido al tamaño creciente de los conjuntos de datos y la naturaleza intensiva en computación de AI y ML, las organizaciones están aprovechando la flexibilidad y los recursos de la nube. La nube pública proporciona mayores cantidades de procesamiento de rendimiento informático y acceso a GPU, colaboración mejorada y acceso a aplicaciones de aprendizaje automático e inteligencia artificial nativas de la nube.
  • ¿Mi sistema de archivos garantiza una alta disponibilidad de mis datos? El sistema de archivos de Qumulo ofrece protección de datos a nivel empresarial utilizando codificación de borrado. Los datos se distribuyen de manera eficiente en varios nodos para protegerlos contra fallas en las unidades. En caso de falla de la unidad, a diferencia de las soluciones RAID tradicionales, el rendimiento no se ve afectado durante las reconstrucciones. La codificación de borrado también requiere menos capacidad (normalmente un 33% menos de espacio) para la resiliencia que RAID.
  • ¿Mi organización sufre de "ceguera de datos"? Los análisis en tiempo real de Qumulo brindan visibilidad y conocimiento de miles de millones de archivos. Las organizaciones obtienen el control, con información sobre toda la plataforma de datos de archivos, lo que les permite predecir las tendencias de uso y capacidad, optimizar los flujos de trabajo y administrar de manera más proactiva los requisitos de almacenamiento actuales y futuros.

Más información

Qumulo tiene varios recursos útiles para aprender más sobre investigación informática y cómo nuestra plataforma de datos de archivos satisface las demandas de rendimiento y capacidad de las organizaciones de ciencias biológicas, en el centro de datos y en la nube.

Pasa por nuestro stand virtual en Mundo Bio-IT esta semana, ¡nos encantaría hablar contigo! Además, mire este seminario web gratuito y bajo demanda conmigo, Adam Kraut de BioTeam, Inc., y Emric Delton de ARUP Laboratories, para conocer algunas de las mejores prácticas sobre cómo acelerar la investigación genómica: "Acelerando la investigación genómica con soluciones de nube híbrida."

Contáctenos aquí si desea programar una reunión o solicita una demo. Y suscríbase a nuestro blog para obtener mejores prácticas y recursos más útiles.

0 0 votos
Valoración del artículo
Suscríbete
Notificarme sobre
invitado
0 Comentarios
Más antiguo
Más Nuevos Más votados
Comentarios en línea
Ver todos los comentarios

Artículos Relacionados

0
Me encantaría tus pensamientos, por favor comenta.x
Ir al Inicio