Couchbase Backup: Restore in K8s (Kubernetes) Environment

1. Introducción

La copia de seguridad periódica de los datos es una parte importante de cualquier despliegue de bases de datos de producción, que ayuda a garantizar la recuperación de los datos en caso de desastre y también minimiza la inconsistencia de los datos cuando se requiere una restauración.

Couchbase proporciona cbbackupmgr que se ha mejorado a lo largo de los años hasta convertirse en una herramienta de copia de seguridad y restauración de nivel empresarial para realizar copias de seguridad de grandes conjuntos de datos con un rendimiento mucho mayor, por lo que recomendamos utilizar esta herramienta en la producción. Cabe mencionar que en Servidor Couchbase 6.5 hemos revisado por completo el motor de copia de seguridad y almacenamiento, y hemos introducido una mayor relación de compresión, lo que ha mejorado mucho el rendimiento de la copia de seguridad y la restauración y ha reducido los requisitos de almacenamiento de cada instantánea de copia de seguridad, con el consiguiente ahorro de costes.

2. 2. Buenas prácticas

Aunque cbbackupmgr existe en Couchbase_HOME, es no Se recomienda ejecutar esta utilidad desde cualquiera de los nodos activos del cluster. Ya que estaría compitiendo por los recursos de las peticiones activas y podría potencialmente obstaculizar el rendimiento de su sistema de base de datos.

Es, por tanto, una buena práctica proporcionar una instancia separada (para las necesidades de copia de seguridad y restauración) con sólo los binarios de Couchbase instalados pero sin los servicios de Couchbase ejecutándose, para que los recursos puedan ser mejor gestionados tanto para el cluster de base de datos como para el nodo de copia de seguridad.

Como se puede ver en la figura anterior, se aprovisiona un nodo de copia de seguridad/restauración separado además de un clúster Couchbase de cinco nodos. Otra buena práctica es asignar suficiente espacio de almacenamiento para almacenar al menos 5 veces el tamaño del conjunto de datos de Couchbase. Objetivo del Punto de Recuperación (OPR) de la empresa.

3. Estrategia de copia de seguridad

cbbackupmgr ofrece un conjunto de comandos que permite a los administradores de bases de datos aplicar la estrategia de copia de seguridad que mejor se adapte a sus necesidades. Estos son algunos de los comandos:

cbbackupmgr copia de seguridad – Copia de seguridad de los datos de un clúster Couchbase.
cbbackupmgr compacto – Compacta una copia de seguridad
cbbackupmgr fusionar – Fusiona las copias de seguridad
cbbackupmgr config – Crea un nuevo repositorio de copias de seguridad
cbbackupmgr list – Lista las copias de seguridad del archivo

Con estos comandos se puede aplicar cualquiera de las tres estrategias de copia de seguridad mencionadas en el documentación. En el siguiente ejemplo, describiremos Fusión periódica en el contexto de Couchbase Cluster ejecutándose en un entorno Kubernetes.

4. Fusión periódica

Esta estrategia de copia de seguridad pretende tener la menor sobrecarga de la base de datos, ya que requiere la menor cantidad de tiempo para realizar la copia de seguridad de los cambios y prácticamente ningún consumo de recursos del clúster de la base de datos para consolidar los datos durante el proceso de compactación y fusión (como ocurre en el nodo de copia de seguridad).

A grandes rasgos, así es como Fusión periódica estrategia funciona:

Configurar el repositorio de copias de seguridad mediante cbbackupmgr config
Realice una copia de seguridad incremental de la base de datos (en el repositorio) utilizando cbbackupmgr copia de seguridad
Realizar la compactación de la copia de seguridad utilizando cbbackupmgr compacto para que el espacio en disco pueda utilizarse de forma eficiente.
Fusionar las copias de seguridad más antiguas con cbbackupmgr fusionar para que el número de copias de seguridad en el repositorio no crezca infinitamente y las necesidades de espacio se mantengan bajo control.

Nota: Los pasos anteriores se recogen en el backup-with-periodic-merge.sh que luego utilizaremos en nuestra configuración de Kubernetes para realizar copias de seguridad periódicas.

5. Copia de seguridad de los datos de Couchbase

En mi último blog sobre Couchbase Autonomous Operator, he descrito paso a paso en cómo desplegar un clúster Couchbase autorreparable y de alta disponibilidad mediante Persistent Volumes. Suponiendo que haya seguido estos pasos y ya haya desplegado el clúster, los pasos siguientes describirán cómo puede configurar la capacidad de copia de seguridad automática utilizando cronjob. Se considera una buena práctica hacer copias de seguridad de los datos con regularidad, así como probar la restauración de las copias de seguridad para confirmar el proceso de restauración antes de que sea realmente necesaria la recuperación en caso de desastre.

Esta funcionalidad no la proporciona el Operador y se deja en manos del administrador del clúster para que defina las políticas de copia de seguridad y pruebe la restauración de los datos. Esta sección describe algunos patrones comunes que pueden emplearse para realizar las funciones requeridas.

5.1. Crear clase de almacenamiento

Las definiciones de recursos de Kubernetes que se muestran a continuación ilustran una disposición típica para la copia de seguridad que guarda el estado de todo el clúster. Primero tendríamos que definir el recurso StorageClass que formatearemos utilizando xfs para un rendimiento óptimo.

# Crear clase de almacenamiento para operaciones de copia de seguridad/restauración
apiVersion: storage.k8s.io/v1
tipo: StorageClass
metadatos:
  labels:
    k8s-addon: storage-aws.addons.k8s.io
  nombre: gp2-backup-storage
parámetros:
  tipo: gp2
  fsTipo: xfs
provisioner: kubernetes.io/aws-ebs
reclaimPolicy: Retener
volumeBindingMode: WaitForFirstConsumer

Utilizando la definición anterior en backup-sc.yaml podemos crear una clase de almacenamiento como ésta:

$ kubectl create -f backup-sc.yaml -n emart

5.2. Crear Volumen Persistente

Un volumen persistente se reclama para mantener los datos a salvo en caso de interrupción. Deberá planificar el tamaño de la reclamación en función del tamaño previsto del conjunto de datos, el número de días de conservación de los datos y si se utilizan copias de seguridad incrementales.

# Definir volumen de almacenamiento de copia de seguridad
tipo: PersistentVolumeClaim
apiVersion: v1
metadatos:
  name: backup-pvc
spec:
  storageClassName: gp2-backup-storage
  recursos:
    peticiones:
      almacenamiento: 50Gi
  modos de acceso:
    - LecturaEscrituraUnaVez

Guardar la definición anterior en backup-pvc.yaml y crear la reclamación:

$ kubectl create -f backup-pvc.yaml -n emart

5.3. Configurar el repositorio de copias de seguridad

Antes de que podamos empezar a tomar instantáneas de nuestros datos periódicamente, necesitamos configurar la ubicación del archivo de copia de seguridad. Se crea un trabajo para montar el volumen persistente e inicializar un repositorio de copias de seguridad. El repositorio se llama couchbase que se asignará al nombre del clúster en especificaciones posteriores.

# Crear un repositorio de copia de seguridad tipo: Trabajo apiVersion: batch/v1 metadatos: nombre: couchbase-cluster-backup-config especificación: plantilla: especificación: contenedores: - nombre: backup-config imagen: couchbase/servidor:enterprise-6.5.0
          comando: ["cbbackupmgr", "config", "--archive", "/backups", "--repo", "couchbase"]
          volumeMounts: - nombre: "couchbase-cluster-backup-volume" ruta de montaje: "/backups" volúmenes: - nombre: couchbase-cluster-backup-volume persistentVolumeClaim: claimName: backup-pvc política de reinicio: Nunca

Guardar la definición anterior en config.yaml y crear un repositorio de copias de seguridad:

$ kubectl create -f config.yaml -n emart

5.3. Ejecutar copia de seguridad como CronJob

Cree un cronjob como se describe en la sección periodic-backup.yaml que realiza una copia de seguridad del clúster Couchbase a) descargando el script de copia de seguridad en el pod b) ejecutando el script y realizando una copia de seguridad de los datos del clúster utilizando el volumen de almacenamiento persistente.

tipo: CronJob apiVersion: batch/v1beta1 metadatos: nombre: couchbase-cluster-backup-create especificación: programación: "*/5 * * * *" plantilla de trabajo: especificación: plantilla: especificación: contenedores:
            #Elimine el script backup-with-periodic-merge para que se pueda extraer uno nuevo con cada ejecución - nombre: delete-script imagen: couchbase/server:enterprise-6.5.0 comando: ["rm", "/backups/backup-with-periodic-merge.sh"]
              volumeMounts: - nombre: "couchbase-cluster-backup-volume" mountPath: "/backups" initContainers: #Descargar el script de copia de seguridad del repositorio git - nombre: wget-backup-script imagen: couchbase/server:enterprise-6.5.0
              comando: ["wget", "https://raw.githubusercontent.com/couchbaselabs/cboperator-hol/master/eks/cb-operator-guide/files/sh/backup-with-periodic-merge.sh", "-P", "/backups/."]
              volumeMounts: - nombre: "couchbase-cluster-backup-volume" mountPath: "/backups" # Cambiar el modo del script de copia de seguridad a ejecución - nombre: chmod-script imagen: couchbase/server:enterprise-6.5.0
              comando: ["chmod", "700", "/backups/backup-with-periodic-merge.sh"]
              volumeMounts: - nombre: "couchbase-cluster-backup-volume" mountPath: "/backups" # Ejecutar el script para que pueda realizar a) Copia de seguridad b) Compactación c) Fusión con cada instantánea - nombre: periodic-merge imagen: couchbase/server:enterprise-6.5.0
              comando: ["sh", "-c" ,"/backups/backup-with-periodic-merge.sh --cluster cbdemo-srv.emart.svc"]
              volumeMounts: - nombre: "couchbase-cluster-backup-volume" ruta de montaje: "/backups" volúmenes: - nombre: couchbase-cluster-backup-volume persistentVolumeClaim: claimName: backup-pvc política de reinicio: Nunca

En el YAML anterior estamos ejecutando la copia de seguridad cada 5 minutos, pero puede cambiar la frecuencia para que pueda cumplir con su RPO de negocio. Como nuestro cluster Couchbase está desplegado dentro del espacio de nombres emart así que desplegaremos el cronjob de copia de seguridad bajo el mismo espacio de nombres:

$ kubectl apply -f periodic-backup.yaml -n emart

cronjob.batch/couchbase-cluster-backup-create creado

5.4 Validar trabajo de copia de seguridad periódica

En este punto, puedes empezar a ver como el cronjob se activa cada 5 minutos. Y una vez que se activa se ejecutará tres initContainers (wget-backup-script, chmod-script, periodic-merge) en orden secuencial seguidos de los comandos cointainers (borrar-guión):

$ kubectl get pods -n emart -w

NAME READY STATUS RESTARTS AGE
backup-node 1/1 En ejecución 0 1d
cbdemo-0000 1/1 En ejecución 0 5d
cbdemo-0001 1/1 En ejecución 0 5d
cbdemo-0002 1/1 En ejecución 0 5d
cbdemo-0003 1/1 En ejecución 0 5d
cbdemo-0004 1/1 En ejecución 0 5d
couchbase-operator-7654d844cb-gn4bw 1/1 En ejecución 0 5d
couchbase-operator-admission-7ff868f54c-5pklx 1/1 En ejecución 0 5d

couchbase-cluster-backup-create-1580357820-tz2hg 0/1 Pendiente 0 2s
couchbase-cluster-backup-create-1580357820-tz2hg 0/1 Pendiente 0 2s
couchbase-cluster-backup-create-1580357820-tz2hg 0/1 Init:0/3 0 2s
couchbase-cluster-backup-create-1580357820-tz2hg 0/1 Init:1/3 0 3s
couchbase-cluster-backup-create-1580357820-tz2hg 0/1 Init:2/3 0 4s
couchbase-cluster-backup-create-1580357820-tz2hg 0/1 Init:2/3 0 6s
couchbase-cluster-backup-create-1580357820-tz2hg 0/1 PodInitializing 0 27s
couchbase-cluster-backup-create-1580357820-tz2hg 0/1 Finalizado 0 30s

Puede ver los registros de cada initContainers después de que el pod muestre el estado Completado. En initContainers que nos interesa se llama fusión periódica:

$ kubectl logs couchbase-cluster-backup-create-1580357820-tz2hg -n emart -c periodic-merge


--------------------------------------------------------- COMIENZO DEL PASO 1: COPIA DE SEGURIDAD: jueves, 30 de enero, 04:17:12 UTC 2020
Ejecutando copia de seguridad... Comando: cbbackupmgr backup --archive /backups --repo couchbase --cluster couchbase://cbdemo-srv.emart.svc --username Administrator --password password --threads 2 Advertencia: barra de progreso desactivada porque el ancho del terminal es inferior a 80 caracteres
Copia de seguridad completada con éxito Copia de seguridad del bucket "gamesim-sample" realizada con éxito Mutaciones copiadas: 586, mutaciones que no se han podido copiar: 0 Eliminaciones copiadas: 0, eliminaciones que no se han podido copiar: 0 Copia de seguridad del bucket "travel-sample" realizada con éxito Mutaciones copiadas: 0, mutaciones que no se han podido copiar: 0
Eliminación respaldada: 0, Eliminación no respaldada: 0 --------------------------------------------------------- COMIENZO DEL PASO 2: COMPACTACIÓN : Jueves, 30 de enero, 04:17:20 UTC 2020 Lista de instantáneas de copia de seguridad... 2020-01-28T23_01_37.592188562Z 2020-01-28T23_03_34.160387835Z
2020-01-28T23_05_08.103740281Z 2020-01-30T04_17_12.702824188Z El nombre de la última copia de seguridad es: 2020-01-30T04_17_12.702824188Z
Compactando la copia de seguridad... Comando: cbbackupmgr compact --archive /backups --repo couchbase --backup 2020-01-30T04_17_12.702824188Z Compactación realizada con éxito, 0 bytes liberados --------------------------------------------------------- COMIENZO DEL PASO 3: Fusión de la copia de seguridad antigua: jueves, 30 de enero, 04:17:24 UTC 2020 Tamaño Elementos Nombre
 604.93 MB - + couchbase 192.00 MB - + 2020-01-28T23_01_37.592188562Z 192.00 MB - + beer-sample 37 GB 0 analytics.json
 414 B 0 bucket-config.json 192,00 MB 7303 + datos 192,00 MB 7303 1024 fragmentos 2 B 0 full-text.json 1,94 KB 1 gsi.json
 784B 1 views.json 192,02 MB - + 2020-01-28T23_03_34.160387835Z 192,02 MB - + travel-sample 0B 0 analytics.json
 416B 0 bucket-config.json 192,00 MB 31591 + datos 192,00 MB 31591 1024 fragmentos 2B 0 full-text.json 15,57 KB 10 gsi.json
 2B 0 views.json 64.02MB - + 2020-01-28T23_05_08.103740281Z 64.02MB - + travel-sample 0B 0 analytics.json
 416B 0 bucket-config.json 64.00MB 0 + datos 64.00MB 0 1024 fragmentos 2B 0 full-text.json 15.57KB 10 gsi.json 2B 0 views.json
 156,89 MB - + 2020-01-30T04_17_12.702824188Z 92,88 MB - + gamesim-sample 0B 0 analytics.json 417B 0 bucket-config.json
 92,88 MB 586 + datos 92,88 MB 586 1024 fragmentos 2B 0 full-text.json 1,95 KB 1 gsi.json 501B 1 views.json 64,02 MB - + travel-sample
 0B 0 analytics.json 416B 0 bucket-config.json 64.00MB 0 + datos 64.00MB 0 1024 fragmentos 2B 0 full-text.json 15.57KB 10 gsi.json
 2B 0 views.json Inicio 2020-01-28T23_01_37.592188562Z, FIN 2020-01-28T23_03_34.160387835Z Fusionando copias de seguridad antiguas...
 Comando: cbbackupmgr merge --archive /backups --repo couchbase --start 2020-01-28T23_01_37.592188562Z --end 2020-01-28T23_03_34.160387835Z

Fusión completada con éxito Tamaño Elementos Nombre 412,92 MB - + couchbase 192,02 MB - + 2020-01-28T23_03_34.160387835Z
 192,02 MB - + travel-sample 37 B 0 analytics.json 416 B 0 bucket-config.json 192,00 MB 31591 + datos 192,00 MB 31591 1024 fragmentos
 2B 0 full-text.json 15.57 KB 10 gsi.json 2B 0 views.json 64.02 MB - + 2020-01-28T23_05_08.103740281Z
 64,02 MB - + travel-sample 0 B 0 analytics.json 416 B 0 bucket-config.json 64,00 MB 0 + datos 64,00 MB 0 1024 fragmentos 2B 0 full-text.json
 15,57 KB 10 gsi.json 2 B 0 views.json 156,89 MB - + 30/01/2020 04:17:12.702824188Z
 92,88 MB - + gamesim-sample 0 B 0 analytics.json 417 B 0 bucket-config.json 92,88 MB 586 + datos 92,88 MB 586 1024 fragmentos
 2B 0 full-text.json 1,95 KB 1 gsi.json 501B 1 views.json 64,02 MB - + travel-sample 0B 0 analytics.json
 416B 0 bucket-config.json 64.00MB 0 + datos 64.00MB 0 1024 fragmentos 2B 0 full-text.json 15.57KB 10 gsi.json 2B 0 views.json

Nota: Como puede verse en los registros anteriores, antes del paso de fusión había cuatro copias de seguridad disponibles y después de la fusión hay tres instantáneas de copia de seguridad que se denominan RESTOREPOINTS en backup-with-periodic-merge.sh guión.

Con esto concluye la sección de copias de seguridad.

6. Restauración de

Al igual que una copia de seguridad, podemos restaurar los datos a un nuevo clúster Couchbase con un trabajo de Kubernetes.

tipo: Trabajo apiVersion: batch/v1 metadatos: nombre: couchbase-cluster-restore especificación: plantilla: especificación: contenedores: - nombre: couchbase-cluster-restore imagen: couchbase/servidor:enterprise-6.0.2
          comando: ["cbbackupmgr", "restore", "--archive", "/backups", "--repo", "couchbase", "--cluster", "couchbase://cbdemo-srv.emart.svc", "--username", "Administrador", "--contraseña", "contraseña"]
          montajes de volumen: - nombre: "couchbase-cluster-backup-volume" ruta de montaje: "/backups" volúmenes: - nombre: couchbase-cluster-backup-volume reclamación de volumen persistente: nombre de la reclamación: backup-pvc política de reinicio: Nunca

Si prefiere crear un pod temporal de copia de seguridad-restauración para ver qué copias de seguridad están disponibles o para solucionar un problema, puede montar el mismo persistentVolumeClaim a un nuevo pod. Esta es la definición del pod que se puede almacenar en backup-pod.yaml:

apiVersion: v1 tipo: Pod metadatos: nombre: nodo-de-reserva especificación: # especificación del contenido del pod contenedores:
    - nombre: backup-pod imagen: couchbase/server:enterprise-6.5.0 # Solo gira y espera eternamente comando: [ "/bin/bash", "-c", "--" ] argumentos: [ "while true; do sleep 30; done;" ]
      volumeMounts: - nombre: "couchbase-cluster-backup-volume" ruta de montaje: "/backups" volúmenes: - nombre: couchbase-cluster-backup-volume persistentVolumeClaim: claimName: backup-pvc política de reinicio: Nunca

Ejecute kubectl para abrir el pod temporalmente:

$ kubectl apply -f br/backup-pod.yaml -n emart
$ kubectl get pods -n emart

NAME READY STATUS RESTARTS AGE
backup-node 1/1 En ejecución 0 3d1h
cbdemo-0000 1/1 En ejecución 0 7d1h
cbdemo-0001 1/1 En ejecución 0 7d1h
cbdemo-0002 1/1 En ejecución 0 7d1h
cbdemo-0003 1/1 En ejecución 0 7d1h
cbdemo-0004 1/1 En ejecución 0 7d1h
couchbase-operator-7654d844cb-gn4bw 1/1 En ejecución 0 7d2h
couchbase-operator-admission-7ff868f54c-5pklx 1/1 En ejecución 0 7d2h

Una vez que el nodo de respaldo está en ejecución, podemos iniciar sesión en ese pod:

$ kubectl exec -it backup-node -n emart -- /bin/bash

root@nodo-de-respaldo:/

Y ejecutar cbbackupmgr list para ver las copias de seguridad existentes:

# cbbackupmgr list --repo couchbase --archive /backups

Tamaño Elementos Nombre
256.04MB - + couchbase
0B - + 2020-01-30T04_17_12.702824188Z
0B - + gamesim-sample
0B 0 analytics.json
0B 0 + datos
0B 0 Error: no se han encontrado fragmentos de datos
0B 0 full-text.json
0B 0 gsi.json
0B 0 views.json
128.02MB - + 2020-01-30T04_18_13.021340423Z
....

Y también puede ejecutar cbbackupmgr restaurar manualmente:

# cbbackupmgr restore --archive /backups --repo couchbase --cluster couchbase://cbdemo-srv.emart.svc --username Administrator --password password

Una vez que haya terminado de restaurar sólo tiene que eliminar el pod:

$ kubectl delete -f backup-pod.yaml -n emart

7. Conclusión

Examinamos paso a paso cómo se puede configurar un cronjob de copia de seguridad, que automatiza el proceso de tomar la copia de seguridad periódica en un intervalo predefinido. Utilizamos un backup-with-periodic-merge.sh que ejecuta a) la copia de seguridad, b) la compactación y c) la fusión en un único script. Este script se utilizó en el periodic-backup.yaml que automatizó el proceso de creación de copias de seguridad en el entorno Kubernetes. Esperamos que utilice las mejores prácticas descritas en este blog y planifique la realización de copias de seguridad periódicas, así como la validación de dichas copias mediante el comando de restauración con regularidad.

Anuj Sahni, Jefe de Arquitectura de Soluciones y Nube, Couchbase

Comparte este artículo

Platform

Self-Managed

Services

Capabilities

By Use Case

By Industry

Popular Docs

Quickstart

Resource Center

About

Partnerships

Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada

Autor

Publicado por Anuj Sahni, Jefe de Arquitectura de Soluciones y Nube, Couchbase

Deja un comentario Cancelar respuesta

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Utilizar Capella gratis

Póngase en contacto