Analytics - Love the Doc Model You’re With

Nos aplicativos de negócios, os dados geralmente são modelados para um grande número de consultas simultâneas de baixa latência. Entretanto, se você quiser obter insights observando as tendências, acabará desejando ter um modelo de dados totalmente diferente. O meio tradicional de fazer a quadratura desse círculo era mover, transformar e carregar os dados em outro lugar, mas isso introduz sua própria série de problemas, incluindo latência inaceitável, várias fontes de verdade e muitas despesas.

Os clientes do Couchbase sabem que o serviço Analytics oferece uma maneira fácil de lidar com relatórios analíticos e de tendências em tempo real sobre os dados que eles têm em produção no momento. Um exemplo disso surgiu recentemente, quando trabalhamos com um cliente que buscava identificar a atividade de clientes de alto nível associada a um programa de fidelidade de parceiros corporativos. O modelo de documento subjacente foi claramente projetado tendo em mente o aplicativo interativo, e não a geração de relatórios. (Isso não é incomum, como você deve saber por experiência própria.) Vamos dar uma olhada rápida no problema e em como o resolvemos.

Exemplo de documento

No nosso caso, o modelo de documento (que dá suporte a um aplicativo de reservas on-line) é composto de quatro seções. A primeira seção inclui identificadores básicos de documentos e aplicativos. A segunda descreve as informações de reserva sobre uma excursão. A terceira contém detalhes sobre um ou mais itinerários associados à reserva, juntamente com os requisitos dos passageiros para um ou mais passageiros. A seção final descreve os programas de fidelidade corporativos aos quais cada um dos passageiros pode pertencer.

{

"_type": "booking",

"_header": {

"created": 1562888960,

"source": "app",

"version": "v1.1"

"booking": {

"status": "BOOKED",

"bookingType": "agency",

"details": {

"agent": "FBL33",

"contact": "Arlene",

"seats": 2,

"excursion": {

"embarking": 1562958000,

"equipment": "123X",

"line": "SRF",

"fromStation": {

"code": "LAX",

"facilityType": 1

"toStation": {

"code": "SOL",

"facilityType": 2

"bookingAgency": "PC",

"agencyType": "3"

}

"itinerary": [

{

"daysOnboard": 1,

"passengers": [

{

"passengerNumber": 1,

"specialAccomodations": false

{

"passengerNumber": 2,

"specialAccomodations": false

}

"itineraryType": "business"

}

"passengerDetails": [

{

"loyaltyId": "aaaabbbbccccdddd",

"passId": 1,

"programType": {

"corporatePartner": true,

"partnerId": 1

}

{

"loyaltyId": "eeeeffffgggghhhh",

"passId": 2,

"programType": {

"corporatePartner": false

}

]

}

Elementos de consulta

Para concluir a análise, meu cliente precisou extrair ou filtrar os seguintes campos:

status, equipamento, embarque (convertido em formato legível por humanos), linha, _type, daysOnboard, passengerNumber, loyaltyId, partnerId

O problema, é claro, é que esses campos existem em níveis hierárquicos totalmente diferentes dentro do modelo de documento. Alguns são valores escalares, prontamente acessíveis a partir de uma simples consulta:

status, equipamento, embarque, linha, _tipo

Outro é um elemento dentro de uma matriz (composta de itinerários de viagem), que deve ser aninhado:

dias a bordo

Dentro dessa mesma matriz há uma segunda matriz (composta de detalhes do passageiro), cujo elemento deve ser usado como uma chave de junção:

passengerNumber

Essa chave de junção é usada para acessar elementos de uma terceira matriz, que, por motivos de aplicativos comerciais, não está aninhada na segunda:

loyaltyId, partnerId

Esses diferentes níveis equivalem a diferentes caminhos de acesso, o que aumenta a complexidade da análise. Felizmente, o N1QL for Analytics fornece as ferramentas sintáticas de que precisamos. Veja abaixo uma descrição passo a passo do processo que você pode usar para criar sua consulta.

Etapa 1 - seleção simples de um elemento escalar

Essa etapa deve ser bastante clara para pessoas com experiência em SQL. Usamos uma instrução select para recuperar um valor escalar do bucket de linhas. Qualificamos o campo de status como parte da seção de reserva e limitamos o número de registros a serem retornados.

select booking.status

from lines

limit 1;

Resultados da consulta:

				
				1
2
3
4
5

						[
  {
    "status": "BOOKED"
  }
]

Etapa 2 - Unnest e adicionar elemento da primeira matriz

Em seguida, adicionamos dados da seção de itinerário do documento. No entanto, como esses elementos estão incorporados em uma matriz, primeiro precisamos aninhá-los.

select l.booking.status,

i.daysOnboard

from lines l

unnest l.itinerary i

limit 1;

Resultados da consulta:

[

{

"status": "BOOKED",

"daysOnboard": 1

}

]

Etapa 3 - Unnest e adicionar elemento da segunda matriz (dentro da primeira)

Agora adicionamos elementos da matriz de passageiros incorporada. (Observe que aumentamos nosso limite para garantir que realmente estamos acessando mais de um elemento da matriz).

select l.booking.status,

i.daysOnboard,

p.passengerNumber

from lines l

unnest l.booking.itinerary i

unnest i.passengers p

limit 2;

Resultados da consulta:

				
					
				1
2
3
4
5
6
7
8
9
10
11
12

						[
  {
    "status": "BOOKED",
    "daysOnboard": 1,
    "passengerNumber": 1
  },
  {
    "status": "BOOKED",
    "daysOnboard": 1,
    "passengerNumber": 2
  }
]

					

			

Etapa 4 - Unnest e adicionar elemento da terceira matriz, acessível por meio de junção

Os elementos do terceiro array (passengerDetails) devem ser aninhados e vinculados aos elementos do array passengers acima. Fazemos isso por meio da cláusula where.

				
					
				1
2
3
4
5
6
7
8
9
10

						select l.booking.status,
       i.daysOnboard,
       p.passengerNumber,
       pd.loyaltyId
from lines l
unnest l.itinerary i
unnest i.passengers p
unnest l.passengerDetails pd
where p.passengerNumber = pd.passId
limit 2;

					

			

Resultados da consulta:

				
					
				1
2
3
4
5
6
7
8
9
10
11
12
13
14

						[
  {
    "status": "BOOKED",
    "daysOnboard": 1,
    "passengerNumber": 1,
    "loyaltyId": "aaaabbbbccccdddd"
  },
  {
    "status": "BOOKED",
    "daysOnboard": 1,
    "passengerNumber": 2,
    "loyaltyId": "eeeeffffgggghhhh"
  }
]

					

			

Etapa 5 - Adicionar os elementos de consulta restantes

Outros campos são necessários para completar a consulta. Observe especialmente o campo _type adicionado à cláusula where. É muito provável que, em um sistema de produção, um bucket contenha documentos de vários tipos. Os resultados da consulta podem ser filtrados na própria consulta (como no exemplo abaixo) ou como parte da criação do conjunto de dados do Analytics.

				
					
				1
2
3
4
5
6
7
8
9
10
11
12

						select l.booking.status, l.booking.details.excursion.equipment, l.booking.details.excursion.line,
       i.daysOnboard,
       p.passengerNumber,
       pd.loyaltyId, pd.programType.partnerId,
       millis_to_str(l.booking.details.excursion.embarking*1000) embarking
from lines l
unnest l.itinerary i
unnest i.passengers p
unnest l.passengerDetails pd
where p.passengerNumber = pd.passId
  and l._type = "booking"
  and str_to_millis("2019-07-12T19:00:00Z") = l.booking.details.excursion.embarking*1000;

					

			

Resultados da consulta:

				
					
				1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

						[
  {
    "embarking": "2019-07-12T19:00:00Z",
    "status": "BOOKED",
    "equipment": "123X",
    "line": "SRF",
    "daysOnboard": 1,
    "passengerNumber": 1,
    "loyaltyId": "aaaabbbbccccdddd",
    "partnerId": 1
  },
  {
    "embarking": "2019-07-12T19:00:00Z",
    "status": "BOOKED",
    "equipment": "123X",
    "line": "SRF",
    "daysOnboard": 1,
    "passengerNumber": 2,
    "loyaltyId": "eeeeffffgggghhhh"
  }
]

					

			

Leitura adicional

O Unnest é um recurso avançado do N1QL for Analytics, que fornece os meios para dominar vários elementos incorporados em seus dados. Mais informações sobre sua sintaxe podem ser encontradas aqui: https://docs.couchbase.com/server/6.0/analytics/3_query.html#Unnest_clauses

Um guia completo do N1QL for Analytics - tenho orgulho de possuir uma cópia assinada dele - pode ser encontrado aqui: https://www.amazon.com/SQL-Users-Tutorial-Don-Chamberlin/dp/0692184503/

Experimente você mesmo

Vá direto para https://docs.couchbase.com/server/6.0/analytics/quick-start.html#Using_docker e comece a usar imediatamente com um tutorial baseado no Docker. Ou, se preferir, faça o download do Couchbase Server 6 Enterprise nesta página: https://www.couchbase.com/downloads

Peter Reale

Compartilhe este artigo

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

Analytics - Ame o modelo de médico com o qual você está

Exemplo de documento

Elementos de consulta

Etapa 1 - seleção simples de um elemento escalar

Etapa 2 - Unnest e adicionar elemento da primeira matriz

Etapa 3 - Unnest e adicionar elemento da segunda matriz (dentro da primeira)

Etapa 4 - Unnest e adicionar elemento da terceira matriz, acessível por meio de junção

Etapa 5 - Adicionar os elementos de consulta restantes

Leitura adicional

Experimente você mesmo

Receba atualizações do blog do Couchbase em sua caixa de entrada

Autor

Postado por Peter Reale, engenheiro de soluções sênior, Couchbase

Deixe um comentário Cancelar resposta

Pronto para começar a usar o Couchbase Capella?

Iniciar a construção

Use o Capella gratuitamente

Entre em contato