Introducción a los enlaces remotos

Couchbase se complace en anunciar su nuevo Enlaces remotos Servicio de análisis en el último Lanzamiento de Couchbase Server 6.6. Los enlaces remotos permiten realizar análisis operativos en tiempo real para obtener y analizar datos de varios clústeres de datos y centros de datos de Couchbase en un clúster independiente dedicado al servicio Analytics.

Caso práctico del cliente

Antes de la versión 6.6, el servicio de análisis estaba disponible en un clúster, pero el servicio y sus análisis estaban vinculados a ese clúster. Varios de nuestros clientes de comercio minorista, estilo de vida y viajes realizaban análisis para sus líneas de negocio (por ejemplo, comercio electrónico, marketing, cadena de suministro, etc.) en clústeres de Couchbase independientes. Expresaron su deseo de unificar los datos de varias aplicaciones operativas en un clúster de análisis centralizado. Esto motivó a nuestros equipos de ingeniería y producto a ayudar a resolver esta necesidad de los clientes. Puedes leer más sobre otros casos de uso de Analytics aquí.

¿Cómo funcionan los enlaces remotos?

Los enlaces remotos permiten la ingestión de datos desde el Servicio de Datos, un cluster remoto de Couchbase en un cluster de Analytics. Esto se consigue en tres sencillos pasos:

  1. Configurar un enlace remoto mediante una llamada a la API REST o la interfaz de línea de comandos (CLI).
  2. Cree un conjunto de datos en el clúster Analytics en el enlace remoto configurado anteriormente
  3. Consultar el conjunto de datos mediante SQL (o su herramienta BI favorita)

Veamos un ejemplo sencillo. iWorks, una empresa de comercio electrónico, vende accesorios para iPhone online. Los datos de los pedidos se almacenan en un cluster de Couchbase en un bucket llamado "ecommerce" con docType "order". Los datos de los clientes se almacenan en un segundo clúster de Couchbase en un bucket llamado "customer360" con docType "customer". iWorks desea utilizar el servicio Analytics para combinar y analizar los datos de los pedidos junto con los datos de los clientes para determinar los 3 clientes principales por ventas. La ilustración que se muestra a continuación es anterior a la configuración de los enlaces remotos:

Muestra de datos de clientes:

Muestra de datos de pedidos:

Sigamos los tres pasos anteriores con un ejemplo de código de configuración junto con una consulta SQL++.

Paso 1: Configurar enlaces remotos

Crearemos dos enlaces remotos en un nuevo clúster de Analytics utilizando una etiqueta API REST llamada. (Como alternativa, puede utilizar la función CLI para crear enlaces remotos.) Primero vamos a configurar el enlace remoto "pedido". Tendremos que proporcionar:

    • Nombre de host del clúster de análisis
    • Credenciales de usuario de Analytics
    • Nombre del enlace remoto (en este caso remoteOrders)
    • Nombre del dataverse (si es diferente del predeterminado)
    • Tipo de enlace como couchbase
    • Ordenar el nombre de host del clúster
    • Solicitar credenciales de usuario
    • Especifique el tipo de cifrado deseado (en este caso, ninguno)

Ahora vamos a configurar el enlace remoto "cliente" en el clúster Analytics. Este paso es similar al anterior, salvo que tenemos que proporcionar un nuevo nombre de enlace remoto (en este caso remoteCustomers) junto con los detalles y las credenciales del host del clúster de clientes. En este caso, elegimos "completo" como tipo de cifrado (a efectos ilustrativos) e incluimos el parámetro de certificado necesario.

El certificado en targetClusterRootCert.pem se puede recuperar desde la consola web del clúster de destino.

 El certificado puede recuperarse accediendo en primer lugar a la página Seguridad de la barra de navegación de la izquierda y, a continuación, a la pestaña Certificado raíz en la barra de control horizontal.

La siguiente ilustración se muestra después de configurar ambos enlaces remotos:

Paso 2: Crear conjuntos de datos y conectar enlaces remotos

Utilizando el banco de trabajo Analytics, crearemos ahora dos conjuntos de datos denominados "pedidos" y "clientes" en los dos enlaces remotos que hemos creado anteriormente:

A continuación, conectaremos los enlaces remoteOrders y remoteCustomers para permitir la ingesta de datos desde el clúster de datos Orders y Customers al clúster Analytics. Esto demuestra la poderosa característica NoETL de JSON analytics. Para ser claros, no se necesita ETL para mover nuestros datos NoSQL JSON de un sistema a otro antes de poder analizarlos. Esto ahorra tiempo y capacidad de procesamiento, lo que nos permite analizar los datos de inmediato y en su forma natural (aplicación) en el clúster Analytics.

Paso 3: Consulta con SQL

Como último paso, ahora podemos ejecutar la consulta SQL++ que se indica a continuación (tiene exactamente el mismo aspecto que SQL :)) para unir pedidos y clientes y obtener los 3 clientes con mayores ventas.

Aquí están los resultados de la consulta JSON:

¡Woohoo! Los enlaces remotos funcionaron y ahora podemos combinar y analizar datos de clientes y pedidos juntos. Ahora los usuarios pueden desarrollar diversas consultas ad hoc complejas para explorar más a fondo los datos, responder a nuevas preguntas de negocio e incorporar fuentes de datos Couchbase adicionales.

Beneficios

Estas son las principales ventajas de utilizar enlaces remotos:

  • Amplíe el alcance de Analytics. La ingesta de datos procedentes de varios clústeres permite consolidar más datos. Los casos de uso incluyen combinar y correlacionar datos de múltiples ubicaciones o múltiples aplicaciones, como acabamos de ver.
  • Reduzca el coste total de propiedad de Analytics. La posibilidad de un clúster de Análisis independiente puede reducir o eliminar la necesidad de incluir nodos de Análisis en cada clúster individual, de nuevo como hemos visto en el ejemplo anterior.
  • Agilice aún más la obtención de información. Los clientes pueden obtener más información de forma inmediata realizando correlaciones entre diferentes conjuntos de datos sin necesidad de publicar primero los datos de interés en un almacén de datos. Fíjese en los pocos pasos necesarios para poder analizar nuestros datos; no hubo ETL y los datos estuvieron disponibles de inmediato.

Resumen

Los enlaces remotos ayudan a reducir el coste total de propiedad, mejoran la utilización de los recursos y permiten un procesamiento transaccional/analítico híbrido (HTAP) para el desarrollo y la implantación de soluciones NoSQL, como suele ser necesario en las aplicaciones modernas. Los enlaces remotos permiten a los usuarios reunir más datos en un único lugar, lo que permite a las organizaciones recopilar más información y realizar más análisis de correlación entre diferentes conjuntos de datos procedentes de distintos clústeres.

Más información sobre Remote Links aquí. Regístrese en aquí para nuestro próximo seminario web "Novedades de la versión 6.6".

Explorar los recursos de Couchbase Server 6.6

 

Blogs

Documentos y tutoriales

Páginas web y seminarios web

Novedades de Couchbase Server 6.6

Novedades de Couchbase Server 6.6

Nuevas funciones de Couchbase Server 6.6: análisis, copias de seguridad, consultas y mucho más

Mejoras en los eventos (temporizadores, controladores y estadísticas)

Notas de la versión de Couchbase Server 6.6

Servicio de análisis Couchbase

Enlaces remotos - Analice su empresa con Couchbase Analytics

Pruebe el servicio Couchbase Index Advisor

Novedades de Couchbase Server (Página del producto)

Conjuntos de datos externos - Amplíe su alcance con Couchbase Analytics

Configuración de enlaces remotos de Analytics y S3 mediante la API REST

Comparar ediciones

Anuncio de Flex Index con Couchbase

Creación de conjuntos de datos externos mediante el lenguaje de definición de datos (DDL)

 

Introducción a las copias de seguridad en Object Store (S3)

Configuración de enlaces remotos de Analytics y S3 mediante CLI

 

Importar documentos con Web Admin Console

   

 

Coautor

Idris Motiwala, Gestor Principal de Productos

Idris es Gerente Principal de Producto, Analítica en Couchbase con más de 20 años de experiencia en diseño, desarrollo y ejecución de productos de software tanto en Fortune 500 como en startups liderando equipos en transformación digital, nube y analítica. Idris tiene un máster en Gestión de Tecnología y certificaciones en gestión de productos.

Autor

Publicado por Till Westmann

Till Westmann es Director Senior de Ingeniería en Couchbase trabajando en el Servicio de Análisis. Antes de unirse a Couchbase, Till desarrolló software de gestión de datos en Oracle, 28msec, SAP, BEA Systems, XQRL y Xyleme. Es miembro de la Apache Software Foundation y vicepresidente del proyecto Apache AsterixDB. Till es doctor por la Universidad de Mannheim (Alemania).

Dejar una respuesta