Cuando se utiliza Couchbase como un sistema persistente de registros es necesario considerar la infraestructura de almacenamiento subyacente. Las decisiones de infraestructura tienen un impacto en el rendimiento general y la disponibilidad del almacén de datos, con el efecto en cadena de afectar a las aplicaciones consumidoras de datos.
Como todos sabemos, el bajo rendimiento, los tiempos de respuesta deficientes y la falta de disponibilidad no son algo que los clientes o las empresas toleren; a menudo provocan frustración, pérdida potencial de clientes en favor de proveedores alternativos, repercusiones financieras, multas reglamentarias e incluso la muerte (por ejemplo, en el caso de los sistemas médicos).
Los clientes buscan una solución que responda a sus expectativas y necesidades.
Retos particulares para los almacenes de datos persistentes
Uno de los principios clave de Couchbase, nuestro ADN si se quiere, se ha basado en ofrecer tiempos de respuesta inferiores al milisegundo y ha sido clave para la adopción de Couchbase por parte de muchos clientes.
Sin embargo, cuando se pasa de una capa de almacenamiento en caché a un almacén de datos persistente, los requisitos y las consideraciones sobre el almacenamiento de datos cambian. Hay que tener en cuenta muchos más aspectos cuando hablamos de almacenar datos en el rango de los petabytes, ya que cada uno de ellos puede tener un gran impacto en el rendimiento general de la solución.
Normalmente, antes de ser adoptada como solución de almacenamiento empresarial, deben garantizarse diversos parámetros para satisfacer requisitos empresariales específicos.
Las soluciones de almacenamiento no son sólo almacenamiento.
Deben cumplir múltiples Acuerdos de Nivel de Servicio exigidos por la empresa, como los Objetivos de Tiempo de Recuperación (RTO) y los Objetivos de Punto de Recuperación (RPO).
Por ejemplo, IOPS, latencia, capacidad de recuperación, alta disponibilidad, comúnmente denominada RAID, copias de seguridad de recuperación ante desastres (DR), acceso a datos - multitrayectoria, calidad del servicio de almacenamiento (QOSS), etc.
Consideraciones clave sobre la infraestructura de almacenamiento persistente
Aunque este blog no puede abordar todos estos puntos (habrá artículos posteriores), pretendemos destacar varios puntos a tener en cuenta.
Couchbase proporciona de forma nativa HA, DR y Backups, pero la infraestructura de almacenamiento subyacente se convierte en el área en la que centrarse para abordar cada una de estas áreas:
Rendimiento
-
-
- satisfacer los requisitos de IOPS y latencia de las aplicaciones
- la capacidad de afinar
-
Independencia de la plataforma
-
-
- compatibilidad con distintos sistemas operativos, Linux (CentOS, Rhel, SUSE), Windows, Unix,
- VMware y Kubernetes
- migraciones multiplataforma en línea
-
Independencia y agilidad de almacenamiento
-
-
- NAS, SAN, DAS, SSD, Nube
- evitar la dependencia de un proveedor si cambian sus necesidades
- integración entre distintos proveedores de almacenamiento
-
Escalabilidad
-
-
- el tamaño del datastore: TB's, PB's, ZB's ...
- la capacidad de crecer / decrecer a demanda
-
Coste
-
-
- limitaciones presupuestarias
- facilidad de gestión/complejidad: gestión centralizada, equipos especializados, herramientas únicas o múltiples
-
Una vez que tengamos la respuesta a las preguntas anteriores, podemos empezar a estudiar qué capa de almacenamiento físico utilizar: Almacenamiento DAS, Almacenamiento NAS o Almacenamiento SAN (HDD y SSD).
Cada uno de ellos tiene diferentes implicaciones de escala, rendimiento, espacio, ubicación, consumo de energía y matriz de costes.
A continuación, siguiendo las opciones anteriores, comience a buscar los requisitos de nivel de sistema operativo (SO), como:
-
- Virtualización
- Sistemas de archivos
- Sistemas de archivos distribuidos
- SDS - Almacenamiento definido por software
- Nube/Almacenamiento de objetos
Almacenamiento
Elegir la solución de almacenamiento adecuada puede tener un gran impacto en sus aplicaciones.
Conseguir que el almacenamiento inicial se adapte correctamente es mejor que intentar adaptarlo más tarde. La mayoría de las organizaciones cuentan con equipos y normas de almacenamiento, por lo que deberá contar con su participación para que aprueben y proporcionen el perfil de almacenamiento que necesita. También tendrá que ser realista y demostrar claramente sus requisitos de rendimiento, unTodo ello teniendo en cuenta las implicaciones económicas y la fuente de financiación.
El primer paso es comprender los objetivos empresariales y las necesidades de la aplicación. A partir de ahí, investigue qué cumplirá sus SLA y los objetivos de la empresa.
La próxima vez: La capa de almacenamiento físico.