Couchbase presentó su Capella totalmente gestionado Base de datos como servicio (DBaaS) en Amazon Web Services (AWS) en 2021, y más recientemente en Google Cloud Platform (GCP). Los clientes ya no tienen que preocuparse de la gestión y el mantenimiento diarios de sus clústeres de Couchbase. Con Capella pueden beneficiarse de una base de datos NoSQL más rápida, sencilla y asequible mientras utilizan SQL para consultar sus datos. Pero, ¿cómo aprovechar las ventajas de Couchbase Capella si tus datos están almacenados en una base de datos relacional heredada? Aquí es donde MOLO17, socio de Couchbase desde hace mucho tiempo, permite a los clientes una transición sin problemas de lo antiguo a lo nuevo.
Migración de datos de RDBMS a NoSQL
Mover datos entre almacenes de datos puede ser complejo y llevar mucho tiempo. Los clientes tienen que desarrollar canalizaciones de datos ETL utilizando costosas herramientas de integración de datos. La mayoría de estas herramientas ni siquiera soportan todas las capacidades necesarias para la transición a una base de datos NoSQL moderna. La migración de un sistema de bases de datos relacionales (RDBMS) a una base de datos moderna no es un acontecimiento puntual en el que los usuarios pasan de un día para otro. Se trata más bien de un proceso gradual en el que el RDBMS existente tiene que coexistir con la nueva base de datos NoSQL durante un periodo de tiempo, que puede ser de semanas, meses e incluso años. Durante este periodo de transición será fundamental sincronizar los datos entre las bases de datos. Los cambios en el RDBMS deben reflejarse en la base de datos NoSQL y viceversa casi en tiempo real.
Las bases de datos de documentos como Couchbase proporcionan flexibilidad en la forma de almacenar datos en documentos JSON. Estos documentos JSON se pueden organizar en ámbitos y colecciones. Al mover una base de datos relacional a Couchbase, puedes mover datos de múltiples tablas a un único documento JSON para optimizar el rendimiento de las consultas. Sin embargo, cuando se realicen upserts o deleciones en estos documentos JSON, será crítico sincronizar las tablas apropiadas en la base de datos relacional. Este nivel de complejidad, que ha supuesto un reto para muchas herramientas de integración de datos, puede abordarse ahora con la plataforma de replicación de datos GlueSync de MOLO17.
Replicación de datos con GlueSync
Vamos a desglosar las diferentes opciones de replicación de datos disponibles con GlueSync. Suponiendo que sus datos se almacenan actualmente en una de las principales bases de datos relacionales como Microsoft SQL Server, Oracle, IBM Db2, MySQL, PostgreSQL, Sybase y otros.tus opciones son:
-
- En el caso más sencillo, se desea migrar datos a Couchbase Capella en un solo evento, entonces sólo usa Capella para todas tus necesidades de datos. GlueSync puede lograr esto usando una replicación instantánea única. Sólo necesitas identificar las tablas y columnas de origen a replicar, y la estructura del documento JSON de destino.
- Lo más habitual es que, una vez replicados los datos en Capella en un único evento, todos los cambios se produzcan en Capella. Sin embargo, también es necesario mover todos los cambios de Capella a la RDBMS hasta que esté seguro con su nuevo entorno de Capella y decida retirar su antigua base de datos. GlueSync puede capturar los cambios de datos a medida que se producen en Capella utilizando el servicio de eventos nativo de Couchbase y replicar los cambios en tiempo real al RDBMS, aprovechando su escalabilidad y rendimiento multidimensionales.
- A menudo, las aplicaciones de bases de datos originales siguen utilizándose a diario, por lo que regularmente llegan nuevos datos a su RDBMS existente. Por supuesto, es fundamental obtener esos datos en Capella de inmediato, en tiempo real. GlueSync admite este enfoque replicando primero todos los datos identificados en la(s) base(s) de datos de origen mediante una replicación instantánea única. Al mismo tiempo, GlueSync empieza a supervisar los cambios en los datos, y los replica a Capella mediante CDC, a medida que se producen en el RDBMS. Como en el caso anterior, pero en orden inverso, al replicar sólo los cambios de datos, GlueSync optimiza el rendimiento tanto en la base de datos de origen como en la de destino, logrando una precisión de los datos casi en tiempo real.
- Por último, GlueSync también puede gestionar el caso de uso más complejo en el que se producen cambios tanto en el RDBMS original como en Capella, pero ambas bases de datos deben estar siempre sincronizadas, implementando tanto el caso 2 como el caso 3. anteriores. Tras realizar una instantánea inicial para copiar los datos del RDBMS a Capella, GlueSync utiliza CDC para replicar los nuevos datos a Capella mientras aprovecha la función Eventing de Couchbase para capturar los cambios en Capella y propagarlos de vuelta al RDBMS.
En resumen, GlueSync puede replicar conjuntos de datos completos o un subconjunto de datos en un solo evento (instantánea) y también puede replicar sólo los datos modificados (CDC) para un rendimiento óptimo. Si los datos actualizados en Couchbase deben volver al RDBMS, GlueSync puede mantener actualizados ambos sistemas de datos, el RDBMS y Couchbase, con una replicación bidireccional. Si GlueSync se encarga de esta tarea crítica y altamente especializada, podrá centrarse en su actividad principal, dejando a GlueSync la tarea de mover los datos hacia delante y hacia atrás.
Conexión de GlueSync a Couchbase y bases de datos relacionales
Instalación y configuración
La arquitectura nativa en la nube y en contenedores de GlueSync hace que la instalación y la configuración sean muy sencillas. GlueSync se distribuye como una aplicación en contenedores Docker que está en su mejor momento cuando se despliega en Kubernetes. Los parámetros de la base de datos de origen y de la conexión de destino de Couchbase se establecen en un sencillo archivo de configuración JSON que se utiliza para ejecutar la aplicación en contenedores dentro de su entorno. El archivo de configuración JSON también identifica tablas y objetos a replicar y contiene parámetros de optimización.
Modelado de datos
La replicación de datos suele implicar la selección de un subconjunto de datos relacionales que replicar: tal vez sólo se necesiten determinados campos de una tabla o deban combinarse valores de diferentes campos en la salida JSON. GlueSync admite el modelado de datos sobre la marcha. Al configurar los parámetros de replicación en el archivo de configuración, puede identificar los campos que desea omitir o renombrar, y definir las sentencias de consulta SQL para agregar, asignar y diseñar una estructura de salida que se transformará en un documento de salida JSON.
Conexiones de bases de datos
Para conectar con la base de datos relacional que contiene los datos a replicar (base de datos fuente), necesitarás un controlador JDBC, normalmente proporcionado por los proveedores de la base de datos. GlueSync utiliza Couchbase Java SDK para conectarse a Couchbase. El equipo de ingeniería de MOLO17 ha trabajado conjuntamente con el equipo de ingeniería de Couchbase para conseguir la mejor integración nativa con Capella y con Couchbase Server. GlueSync siempre utiliza los últimos SDKs de Couchbase para evitar problemas de depreciación o incompatibilidad.
Tanto si trabajas con Couchbase Capella, Server o Mobile, GlueSync soporta tecnologías nativas de Couchbase como Eventing, App Services y SyncGateway para replicar datos entre RDBMS o bases de datos NoSQL y Couchbase.
Ventajas de GlueSync
Si su empresa está pasando por un modernización de datos o proceso de modernización de aplicaciones y ha decidido adoptar Couchbase Capella como su plataforma de datos DBaaS, eche un vistazo a MOLO17 GlueSync para replicar datos de forma fácil y segura desde las bases de datos relacionales existentes a Capella y viceversa. Estas son las principales ventajas que proporcionará GlueSync:
Mayor disponibilidad de datos
GlueSync creará un conducto fiable y seguro para transportar los datos procedentes de sus bases de datos relacionales, aún relevantes, a la nueva y estratégicamente importante plataforma Capella. Una vez que GlueSync esté correctamente instalado y configurado, podrá olvidarse de él. Hará su trabajo entre bastidores y le proporcionará datos fiables y coherentes allí donde los necesite.
Mayor rendimiento global
Trasladar eficazmente sus datos a una plataforma de alto rendimiento como Couchbase Capella con MOLO17 GlueSync le permitirá escalar adecuadamente sus aplicaciones empresariales para obtener resultados de negocio óptimos. Con GlueSync y su diseño resistente, de baja latencia y tolerante a fallos, el rendimiento está asegurado al trasladar sus datos de las instalaciones a la nube.
Proceso de replicación sin riesgos
Confiando el proceso de replicación a GlueSync en lugar de seguir un enfoque de "hágalo usted mismo", podrá confiar en un producto implementado y probado por MOLO17, un veterano en el mercado de la replicación de datos, y siempre ahí para apoyarle en su viaje de replicación de datos.
Mejor análisis de datos
GlueSync te permitirá descargar datos de un RDBMS sobrecargado a una plataforma de base de datos como servicio altamente escalable. Esto permitirá a los equipos distribuidos que trabajan en analítica sacar el máximo partido de Couchbase Capella.
Menor coste total de propiedad de la solución
Utilizar GlueSync para trasladar datos de RDBMS a Capella significa confiar en productos que prácticamente no requieren mantenimiento. Además, dispondrá de una solución con alta disponibilidad y escalado automatizado en la que podrá añadir, eliminar o cambiar nodos fácilmente para satisfacer sus necesidades actuales sin cambios en la aplicación.
Prueba gratuita
Puede acceder a una licencia de evaluación gratuita de MOLO17 GlueSync de la siguiente manera rellenando este formulario de contacto (especificando que desea evaluar GlueSync).
Para obtener una versión de prueba gratuita de Couchbase Capella, visite https://cloud.couchbase.com/sign-up