Ampliar Couchbase Analytics con RapidMiner utilizando CData
Este artículo le guiará a través de los pasos necesarios para configurar la conexión de RapidMiner a Couchbase Analytics usando el driver CData JDBC para Couchbase. Más detalles acerca de este controlador pueden ser aquí.
Requisitos previos
Couchbase
Primero necesitarás un cluster de Couchbase Server Enterprise Edition (EE) 6.x con los servicios Data y Analytic habilitados. Estoy usando una instalación local de un solo nodo de Couchbase Server EE, pero la información de este artículo se aplica a cualquier clúster de Couchbase Server EE.
Si no dispone de un clúster de Couchbase Server EE, los siguientes enlaces le ayudarán a ponerlo en marcha rápidamente:
- Descargar Couchbase Server EE
- Instalar Couchbase Server EE
- Aprovisionar un clúster de un solo nodo (NOTA: utilice los valores predeterminados para la configuración del clúster)
Controlador CData JDBC para Couchbase
A continuación, tendrá que descargar e instalar el Controlador CData JDBC para Couchbase.
Una vez descargado y desempaquetado, deberá configurar la licencia:
Activación por línea de comandos
El proceso de instalación debería instalar automáticamente una licencia para su sistema. Sin embargo, también puede instalar una licencia desde la línea de comandos a través de cdata.jdbc.couchbase.jar. Para ello, ejecute el siguiente comando: java -jar cdata.jdbc.couchbase.jar -license. Este proceso creará una cdata.jdbc.couchbase.lic que debe residir junto a la jarra o en el .cdata bajo el directorio personal del usuario.
Instalación de la licencia de prueba
El proceso de instalación debería instalar automáticamente una licencia de prueba para su sistema. También puede utilizar el método descrito en la sección "Activación por línea de comandos" para instalar una licencia de prueba. Simplemente introduzca "TRIAL" como clave del producto cuando se le solicite.
Nota** El cdata.jdbc.couchbase.lic debe residir junto al jar o en la carpeta .cdata bajo el directorio personal del usuario. Por ejemplo, "/Users/justinsimpson/.CData/cdata.jdbc.couchbase.lic".
Configuración de Couchbase
En Couchbase, haga clic en Ajustes
Entonces Cubos de muestra
La casilla de verificación de la muestra de cerveza y seleccione Cargar datos de muestra. A continuación, puede navegar de nuevo a su Cubos y ver muestra de cerveza.
Una vez completado esto, tendremos que configurar Analytics.
Seleccione Analítica, a continuación, cree el conjunto de datos sombra de cervezas del cubo de muestra de cerveza.

Crear un conjunto de datos en Couchbase Analytics
1 |
CREAR DATASET cervezas EN `cerveza-muestra` DONDE `tipo` = "cerveza"; |
Haga clic en Ejecutar, esto creará la definición del conjunto de datos sombra.
Quiero repetir este paso creando un segundo conjunto de datos sombra con la siguiente definición.
1 |
CREAR DATASET cervecerías EN `cerveza-muestra` DONDE `tipo` = "cervecería"; |
A continuación querrás inicializarlo activando el conjunto de datos con lo siguiente.
1 |
CONECTAR ENLACE Local; |
Haga clic en Ejecutar.
Ahora puede probarlo en el panel de control de Analytics ejecutando algo como lo siguiente.
1 2 3 |
SELECCIONE CONTAR(*) DESDE cervezas UNIÓN TODOS SELECCIONE CONTAR(*) DESDE cervecerías; |
Más información sobre Couchbase Analytics aquí.
La configuración de Couchbase está completa.
Configurar RapidMiner
Para llevar a cabo la sencilla tarea de utilizar RapidMiner como una extensión de Couchbase Analytics, hay 2 pasos básicos.
- Establecer una conexión
- Cree un proceso que tenga 2 operadores para 'Leer Base de Datos'. También puede almacenar los resultados localmente para combinarlos y utilizar otros operadores y procesos dentro de RapidMiner.
Establecer una conexión
En RapidMiner, parto de un proceso en blanco. En conexiones selecciono Crear conexión y darle un nombre de conexión. En este ejemplo utilizo 'CBLocal'.

Configuración de la conexión JDBC de RapidMiner Connection
En el Configurar me aseguro de que el sistema de base de datos está configurado como "Personalizado (configurar en la pestaña Controlador)" y selecciono Configurar URL manualmente.

Configurar RapidMiner Connection JDBC URL para Couchbase Analytics
Relleno la URL con lo siguiente:
1 |
jdbc:couchbase:Usuario=Administrador;Contraseña=contraseña;Servidor=localhost;CouchbaseService=Analítica;Dataverse=Por defecto;ConsultaPassthrough=verdadero;verbosidad=5;AplanarRegistros=4 |
Todas las opciones y detalles de la cadena de conexión se encuentran en la sección Opciones de cadena de conexión CData JDBC.
A continuación, seleccione la opción Conductor para finalizar la configuración.
Para configurar el archivo jar del controlador JDBC, haga clic en el icono de carpeta para buscar la ubicación de cdata.jdbc.couchase.jar. Una vez seleccionado, puedes elegir 'cdata.jdbc.couchbase.CouchbaseDriver' en la lista desplegable.

Configuración del controlador JDBC de RapidMiner Connection para Couchbase Analytics
Ahora puede hacer clic en Probar conexión para comprobar que la configuración se ha completado.
Uso de RapidMiner
Ahora que RapidMiner tiene una nueva conexión configurada, es el momento de cargar algunos datos.
Partir de un proceso en blanco.
- Arrastre y suelte el operador "Leer base de datos" (es importante conectar la salida (out) con los resultados (res) en la ventana Proceso).
- Seleccione la conexión que acaba de crear
- Seleccione Build SQL Query e introduzca la consulta que desea pasar a Couchbase Analytics
1SELECCIONE brewery_id,nombre,estilo,abv DESDE cervezas; - Haz clic en el botón "Reproducir" para ver los resultados.

Configuración del operador de lectura de base de datos RapidMiner desde Couchbase Analytics
Mi conjunto de resultados tiene este aspecto...

Resultados de RapidMiner a partir de Couchbase Analytics
Si quisiera almacenar esos resultados y crear múltiples conjuntos de datos para utilizar otras herramientas RapidMiner, sólo tendría que añadir un operador adicional arrastrando el operador "Almacenar" y configurando la ubicación en la que desea almacenar los datos.
Nota** Debe asegurarse de que la conexión de la salida (out) del operador "Leer base de datos" a la entrada (inp) del operador Almacenar está configurada correctamente.

Configurar RapidMiner Store
A continuación, repetí este proceso para el otro conjunto de datos en la sombra que creamos, "cervecerías", como puede verse más arriba en la sección de datos.
Más información sobre Rapid Miner Studio aquí.
Próximos pasos
Descargar Couchbaseconfiguración Analíticay empezar a utilizar RapidMiner con sus datos y vea qué información puede obtener. Amplíe Analytics con otras herramientas gracias a las numerosas Controladores CData de Couchbase que están a tu alcance.