Análisis de Couchbase

Ampliar Couchbase Analytics con RapidMiner utilizando CData

Ampliar Couchbase Analytics con RapidMiner utilizando CData

Este artículo le guiará a través de los pasos necesarios para configurar la conexión de RapidMiner a Couchbase Analytics usando el driver CData JDBC para Couchbase. Más detalles acerca de este controlador pueden ser aquí.

Requisitos previos

Couchbase

Primero necesitarás un cluster de Couchbase Server Enterprise Edition (EE) 6.x con los servicios Data y Analytic habilitados. Estoy usando una instalación local de un solo nodo de Couchbase Server EE, pero la información de este artículo se aplica a cualquier clúster de Couchbase Server EE.

Si no dispone de un clúster de Couchbase Server EE, los siguientes enlaces le ayudarán a ponerlo en marcha rápidamente:

  1. Descargar Couchbase Server EE
  2. Instalar Couchbase Server EE
  3. Aprovisionar un clúster de un solo nodo (NOTA: utilice los valores predeterminados para la configuración del clúster)

Controlador CData JDBC para Couchbase

A continuación, tendrá que descargar e instalar el Controlador CData JDBC para Couchbase.

Una vez descargado y desempaquetado, deberá configurar la licencia:

Activación por línea de comandos

El proceso de instalación debería instalar automáticamente una licencia para su sistema. Sin embargo, también puede instalar una licencia desde la línea de comandos a través de cdata.jdbc.couchbase.jar. Para ello, ejecute el siguiente comando: java -jar cdata.jdbc.couchbase.jar -license. Este proceso creará una cdata.jdbc.couchbase.lic que debe residir junto a la jarra o en el .cdata bajo el directorio personal del usuario.

Instalación de la licencia de prueba

El proceso de instalación debería instalar automáticamente una licencia de prueba para su sistema. También puede utilizar el método descrito en la sección "Activación por línea de comandos" para instalar una licencia de prueba. Simplemente introduzca "TRIAL" como clave del producto cuando se le solicite.

Nota** El cdata.jdbc.couchbase.lic debe residir junto al jar o en la carpeta .cdata bajo el directorio personal del usuario. Por ejemplo, "/Users/justinsimpson/.CData/cdata.jdbc.couchbase.lic".

Configuración de Couchbase

En Couchbase, haga clic en Ajustes 

Entonces Cubos de muestra

La casilla de verificación de la muestra de cerveza y seleccione Cargar datos de muestra.  A continuación, puede navegar de nuevo a su Cubos y ver muestra de cerveza.

Una vez completado esto, tendremos que configurar Analytics.

Seleccione Analítica, a continuación, cree el conjunto de datos sombra de cervezas del cubo de muestra de cerveza.

Create Dataset in Couchbase Analytics

Crear un conjunto de datos en Couchbase Analytics



Haga clic en Ejecutar, esto creará la definición del conjunto de datos sombra.

Quiero repetir este paso creando un segundo conjunto de datos sombra con la siguiente definición.

A continuación querrás inicializarlo activando el conjunto de datos con lo siguiente.

Haga clic en Ejecutar.

Ahora puede probarlo en el panel de control de Analytics ejecutando algo como lo siguiente.

Más información sobre Couchbase Analytics aquí.

La configuración de Couchbase está completa.

Configurar RapidMiner

Para llevar a cabo la sencilla tarea de utilizar RapidMiner como una extensión de Couchbase Analytics, hay 2 pasos básicos.

  1. Establecer una conexión
  2. Cree un proceso que tenga 2 operadores para 'Leer Base de Datos'. También puede almacenar los resultados localmente para combinarlos y utilizar otros operadores y procesos dentro de RapidMiner.

Establecer una conexión

En RapidMiner, parto de un proceso en blanco. En conexiones selecciono Crear conexión y darle un nombre de conexión. En este ejemplo utilizo 'CBLocal'.

Setup RapidMiner Connection JDBC Connection

Configuración de la conexión JDBC de RapidMiner Connection

En el Configurar me aseguro de que el sistema de base de datos está configurado como "Personalizado (configurar en la pestaña Controlador)" y selecciono Configurar URL manualmente.

Setup RapidMiner Connection JDBC URL for Couchbase Analytics

Configurar RapidMiner Connection JDBC URL para Couchbase Analytics

Relleno la URL con lo siguiente:

Todas las opciones y detalles de la cadena de conexión se encuentran en la sección Opciones de cadena de conexión CData JDBC.

A continuación, seleccione la opción Conductor para finalizar la configuración.

Para configurar el archivo jar del controlador JDBC, haga clic en el icono de carpeta para buscar la ubicación de cdata.jdbc.couchase.jar. Una vez seleccionado, puedes elegir 'cdata.jdbc.couchbase.CouchbaseDriver' en la lista desplegable.

Setup RapidMiner Connection JDBC Driver for Couchbase Analytics

Configuración del controlador JDBC de RapidMiner Connection para Couchbase Analytics

Ahora puede hacer clic en Probar conexión para comprobar que la configuración se ha completado.

Uso de RapidMiner

Ahora que RapidMiner tiene una nueva conexión configurada, es el momento de cargar algunos datos.

Partir de un proceso en blanco.

  1. Arrastre y suelte el operador "Leer base de datos" (es importante conectar la salida (out) con los resultados (res) en la ventana Proceso).
  2. Seleccione la conexión que acaba de crear
  3. Seleccione Build SQL Query e introduzca la consulta que desea pasar a Couchbase Analytics
  4. Haz clic en el botón "Reproducir" para ver los resultados.
Setup RapidMiner Read Database Operator from Couchbase Analytics

Configuración del operador de lectura de base de datos RapidMiner desde Couchbase Analytics

Mi conjunto de resultados tiene este aspecto...

RapidMiner Results from Couchbase Analytics

Resultados de RapidMiner a partir de Couchbase Analytics

Si quisiera almacenar esos resultados y crear múltiples conjuntos de datos para utilizar otras herramientas RapidMiner, sólo tendría que añadir un operador adicional arrastrando el operador "Almacenar" y configurando la ubicación en la que desea almacenar los datos.

Nota**  Debe asegurarse de que la conexión de la salida (out) del operador "Leer base de datos" a la entrada (inp) del operador Almacenar está configurada correctamente.

Setup RapidMiner Store

Configurar RapidMiner Store

A continuación, repetí este proceso para el otro conjunto de datos en la sombra que creamos, "cervecerías", como puede verse más arriba en la sección de datos.

Más información sobre Rapid Miner Studio aquí.

Próximos pasos

Descargar Couchbaseconfiguración Analíticay empezar a utilizar RapidMiner con sus datos y vea qué información puede obtener. Amplíe Analytics con otras herramientas gracias a las numerosas Controladores CData de Couchbase que están a tu alcance.

Comparte este artículo
Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada
Este campo es obligatorio.

Autor

Publicado por Justin Simpson, Ingeniero de soluciones, Couchbase

Justin Simpson es ingeniero de soluciones en Couchbase y lleva trabajando en TI y tecnología desde 2004. Reside en el área de Cincinnati, Ohio.

Deja un comentario

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Consulte nuestro portal para desarrolladores para explorar NoSQL, buscar recursos y empezar con tutoriales.

Utilizar Capella gratis

Ponte manos a la obra con Couchbase en unos pocos clics. Capella DBaaS es la forma más fácil y rápida de empezar.

Póngase en contacto

¿Quieres saber más sobre las ofertas de Couchbase? Permítanos ayudarle.