Ampliar o Couchbase Analytics com o RapidMiner usando CData

Este artigo o guiará pelas etapas necessárias para configurar a conexão do RapidMiner com o Couchbase Analytics usando o driver CData JDBC para o Couchbase. Mais detalhes sobre esse driver podem ser encontrados em encontrado aqui.

Pré-requisitos

Couchbase

Primeiro, você precisará de um cluster do Couchbase Server Enterprise Edition (EE) 6.x com os serviços Data e Analytic ativados. Estou usando uma instalação local de nó único do Couchbase Server EE, mas as informações deste artigo se aplicam a qualquer cluster do Couchbase Server EE.

Se você não tiver um cluster existente do Couchbase Server EE, os links a seguir o ajudarão a começar a trabalhar rapidamente:

  1. Download do Couchbase Server EE
  2. Instalar o Couchbase Server EE
  3. Provisione um cluster de nó único (OBSERVAÇÃO: use os valores padrão para a configuração do cluster)

Driver CData JDBC para Couchbase

Em seguida, você precisará fazer download e instalar o Driver CData JDBC para Couchbase.

Após o download e a descompactação, você deverá configurar a licença:

Ativação da linha de comando

O processo de configuração deve instalar automaticamente uma licença para seu sistema. No entanto, você também pode instalar uma licença a partir da linha de comando via cdata.jdbc.couchbase.jar. Para isso, execute o seguinte comando: java -jar cdata.jdbc.couchbase.jar -license. Esse processo criará um arquivo cdata.jdbc.couchbase.lic que deve residir próximo ao jarro ou no .cdata no diretório inicial do usuário.

Instalação da licença de teste

O processo de configuração deve instalar automaticamente uma licença de avaliação para seu sistema. Você também pode usar o método descrito na seção "Ativação por linha de comando" acima para instalar uma licença de avaliação. Basta digitar "TRIAL" como a chave do produto quando solicitado.

Observação** O cdata.jdbc.couchbase.lic deve residir ao lado do jar ou no diretório .cdata sob o diretório inicial do usuário, ou seja, "/Users/justinsimpson/.CData/cdata.jdbc.couchbase.lic"

Configuração do Couchbase

No Couchbase, clique em Configurações 

Então Baldes de amostra

Marque a caixa de seleção da amostra de cerveja e selecione Carregar dados de amostra.  Em seguida, você pode navegar de volta para sua Baldes e veja amostra de cerveja.

Quando isso for concluído, precisaremos configurar o Analytics.

Selecione Análises, em seguida, crie o conjunto de dados sombra de cervejas do balde de amostra de cerveja.

Create Dataset in Couchbase Analytics

Criar conjunto de dados no Couchbase Analytics



Clique em Executar, isso criará a definição do conjunto de dados shadow.

Quero repetir essa etapa criando um segundo conjunto de dados shadow com a seguinte definição.

Em seguida, você deverá inicializá-lo ativando o conjunto de dados com o seguinte.

Clique em Execute (Executar).

Agora você pode testar isso no painel do Analytics executando algo como o seguinte.

Mais informações sobre o Couchbase Analytics podem ser encontradas em encontrado aqui.

Sua configuração do Couchbase está concluída!

Configuração do RapidMiner

Para realizar a tarefa simples de usar o RapidMiner como uma extensão do Couchbase Analytics, há duas etapas básicas.

  1. Configurar uma conexão
  2. Crie um processo que tenha 2 operadores para 'Read Database'. Talvez você também queira armazenar esses resultados localmente para combiná-los e usar outros operadores e processos no RapidMiner.

Configurar uma conexão

No RapidMiner, inicio em um processo em branco. Em conexões, seleciono Criar conexão e dar a ele um nome de conexão. Neste exemplo, usei "CBLocal".

Setup RapidMiner Connection JDBC Connection

Configuração da conexão RapidMiner Conexão JDBC

No Configuração certifico-me de que o sistema de banco de dados esteja definido como "Personalizado (configurado na guia Driver) e seleciono Configurar URL manualmente.

Setup RapidMiner Connection JDBC URL for Couchbase Analytics

Configuração do URL JDBC da conexão do RapidMiner para o Couchbase Analytics

Preencho o URL com o seguinte:

Todas as opções e detalhes da string de conexão podem ser encontrados na seção Opções de string de conexão CData JDBC.

Em seguida, selecione o Motorista para concluir a configuração.

Para configurar o arquivo Jar do driver JDBC, clique no ícone da pasta para navegar até o local do cdata.jdbc.couchase.jar. Uma vez selecionado, você pode escolher "cdata.jdbc.couchbase.CouchbaseDriver" na lista suspensa.

Setup RapidMiner Connection JDBC Driver for Couchbase Analytics

Configuração do driver JDBC do RapidMiner Connection para o Couchbase Analytics

Agora você pode clicar em Testar conexão para verificar se a configuração foi concluída.

Usando o RapidMiner

Agora que o RapidMiner tem uma nova conexão configurada, é hora de carregar alguns dados!

Comece com um processo em branco.

  1. Arraste e solte o operador "Read Database" (é importante conectar a saída (out) aos resultados (res) na janela Process)
  2. Selecione a conexão que você acabou de criar
  3. Selecione Build SQL Query (Criar consulta SQL) e digite a consulta que você gostaria de passar para o Couchbase Analytics
  4. Clique no botão "Play" para ver os resultados!
Setup RapidMiner Read Database Operator from Couchbase Analytics

Configuração do RapidMiner Read Database Operator do Couchbase Analytics

Meu conjunto de resultados tem a seguinte aparência...

RapidMiner Results from Couchbase Analytics

Resultados do RapidMiner a partir do Couchbase Analytics

Se você quiser armazenar esses resultados e criar vários conjuntos de dados para utilizar outras ferramentas do RapidMiner, basta adicionar um operador adicional arrastando o operador 'Store' e definindo o local onde deseja armazenar os dados.

Observação**  Você precisa se certificar de que a conexão da saída (out) do operador "Read Database" (Ler banco de dados) para a entrada (inp) do operador Store esteja definida corretamente.

Setup RapidMiner Store

Configurar o RapidMiner Store

Em seguida, repeti esse processo para o outro conjunto de dados sombra que criamos "cervejarias", como pode ser visto acima na seção de dados.

Mais informações sobre o Rapid Miner Studio podem ser encontrado aqui.

Próximas etapas

Baixar o Couchbase, configuração Análisese começar a usar RapidMiner com seus dados e veja quais insights você pode obter. Amplie o Analytics com outras ferramentas usando os diversos recursos do Drivers CData do Couchbase que estão na ponta de seus dedos.

Autor

Postado por Justin Simpson, engenheiro de soluções, Couchbase

Justin Simpson é engenheiro de soluções da Couchbase e trabalha com TI e tecnologia desde 2004. Ele mora na região de Cincinnati, Ohio.

Deixar uma resposta