A SQL++ Implementation

Resumo

Com a proliferação de bancos de dados JSON nos últimos anos, uma nova linguagem de consulta SQL++ começou a surgir para padronizar a forma de acessar essas fontes de dados. Na verdade, a linguagem já existe há alguns anos, mas tem existido principalmente no âmbito acadêmico. O Couchbase N1QL, uma linguagem SQL para dados JSON, foi lançado em 2015. A empresa continuou a desenvolver sua linguagem N1QL/SQL++ e, em outubro de 2018, lançou anunciado o lançamento do Couchbase Analytics. Don Chamberlinco-inventor do SQL original, também é autor de um Livro tutorial de SQL++ com exemplos práticos que funcionam com o Couchbase Analytics.

Visão geral

O SQL++ é uma linguagem de consulta de banco de dados projetada para trabalhar com dados estruturados e semiestruturados. A linguagem é baseada no SQL original com extensões para trabalhar com banco de dados de documentos JSON. Em bancos de dados relacionais, os dados são representados em forma de tabela. Cada uma das linhas de uma tabela tem a mesma estrutura de registro simples, com nomes e tipos de campo idênticos (de acordo com o esquema da tabela). Os bancos de dados semiestruturados relaxam essas restrições, permitindo que os registros sejam aninhados, tenham nomes e tipos de campos diferentes e não exijam um esquema. Dessa forma, o SQL++ "estende" o SQL, o padrão de linguagem de consulta usado no mundo relacional, relaxando suas restrições no modelo de dados. Ao fazer isso, o SQL++ mantém os benefícios do SQL, incluindo sua natureza declarativa de alto nível, ao mesmo tempo em que permite lidar com as estruturas mais flexíveis comumente encontradas no mundo semiestruturado. Fornecedores de bancos de dados relacionais como IBM, Microsoft e Oracle, bem como sistemas de código aberto como PostgreSQL e MySQL, estenderam suas próprias versões do SQL para trabalhar com dados JSON. Eles adicionam extensões (geralmente específicas do sistema) para JSON como um tipo de coluna, bem como novas funções e, em alguns casos, nova sintaxe, para permitir a manipulação de documentos JSON[1][2][3][4][5] O próprio padrão ANSI/ISO SQL foi ampliado de forma semelhante em 2016[6].

Por outro lado, conforme explicado acima, o SQL++ foi desenvolvido relaxando o modelo de dados de destino do SQL para chegar a uma linguagem de consulta em que os dados JSON são tratados como dados de "primeira classe" e em que os dados relacionais são um caso especial cujos registros são regulares, de tipo idêntico e não aninhados.[7]

Histórico

O SQL++ foi originalmente desenvolvido por Yannis Papakonstantinou e outros na Universidade da Califórnia, em San Diego^[8]. O SQL++ também foi usado no projeto FORWARD, financiado pela NSF^[9] na UCSD.

Aplicativos

Um dos primeiros a adotar o SQL++ foi Apache AsterixDBum sistema de gerenciamento de Big Data de código aberto, originalmente co-desenvolvido por uma equipe de professores, funcionários e alunos da UC Irvine e UC Riverside em 2009. Outro dos primeiros a adotar o SQL++ é a Couchbase, Inc., um fornecedor de banco de dados JSON dimensionável cuja versão 6.0 adotou o SQL++ para o Couchbase Analytics [8] oferta.

Livros

Donald D Chamberlinum dos principais projetistas da especificação original da linguagem SQL, criou um tutorial para a linguagem SQL++[11] que inclui exemplos práticos para mostrar como a linguagem funciona com o Couchbase Analytics.

Exemplos

SELECIONAR E SELECIONAR VALOR

Uma das principais diferenças entre o SQL e o SQL++ está no formato do resultado. O SQL padrão, projetado para linha e tabela, retorna o conjunto de resultados em um formato de tabela. O SQL++, por outro lado, retorna o conjunto de resultados no formato JSON.

(Q1) Liste a identificação do cliente, o nome, o CEP e a classificação de crédito de todos os clientes, em ordem por identificação do cliente.

SELECT custid, name, address.zipcode, rating 
FROM customers ORDER BY custid LIMIT 2; 

Result: 
[ 
  { 	"custid"	: "C13", 
	"Name"		: "T. Cruise", 
	"Zipcode"	: "63101",
	"Rating"	: 750 
  }, 
  {     "custid"	: "C25", 
	"Name"		: "M. Streep", 
	"Zipcode"	: "02340",
	"Rating"	: 690 
  }
]

SELECT custid, name, address.zipcode, rating

FROM customers ORDER BY custid LIMIT 2;

Result:

[

{ "custid" : "C13",

"Name" : "T. Cruise",

"Zipcode" : "63101",

"Rating" : 750

{ "custid" : "C25",

"Name" : "M. Streep",

"Zipcode" : "02340",

"Rating" : 690

}

]

(Q2) Encontre os nomes dos clientes com uma classificação maior que 650.

SELECT name FROM customers WHERE rating > 650;

Result:
[   
  { "name": "T. Cruise" },
  { "name": "M. Streep" },
  { "name": "T. Hanks"  } 
]

SELECT name FROM customers WHERE rating > 650;

Result:

[

{ "name": "T. Cruise" },

{ "name": "M. Streep" },

{ "name": "T. Hanks" }

]

(Q3) Mostra os efeitos de SELECT VALUE (compare com Q2).

SELECT VALUE name FROM customers Queries WHERE rating > 650;

Result:
[ "T. Cruise", "M. Streep", "T. Hanks" ]

SELECT VALUE name FROM customers Queries WHERE rating > 650;

Result:

[ "T. Cruise", "M. Streep", "T. Hanks" ]

Uma consulta SELECT VALUE pode ser usada com um construtor de objetos para criar rótulos ou para dar alguma estrutura a um resultado de consulta, como no exemplo a seguir.

(Q4) Liste os clientes com classificação de crédito superior a 650, em ordem decrescente de classificação de crédito, e novamente em ordem crescente por CEP.

SELECT VALUE 
{ "high-rated customers, ordered by rating": 
  (SELECT c.rating, c.custid, c.name 
      FROM customers AS c WHERE c.rating > 650 
      ORDER BY c.rating DESC), 
  "high-rated customers, ordered by zipcode": 
  (SELECT c.address.zipcode, c.custid, c.name 
      FROM customers AS c WHERE c.rating > 650 
      ORDER BY c.address.zipcode) 
};
Result:
[ 
   { "high-rated customers, ordered by rating": 
    [ { "rating": 750, "custid": "C13", "name": "T. Cruise" }, 
      { "rating": 750, "custid": "C37", "name": "T. Hanks" }, 
      { "rating": 690, "custid": "C25", "name": "M. Streep" } 
    ], 
    "high-rated customers, ordered by zipcode": 
    [ { "zipcode": "02115", "custid": "C37", "name": "T. Hanks" }, 
      { "zipcode": "02340", "custid": "C25", "name": "M. Streep" }, 
      { "zipcode": "63101", "custid": "C13", "name": "T. Cruise" } 
    ] 
   } 
]

SELECT VALUE

{ "high-rated customers, ordered by rating":

(SELECT c.rating, c.custid, c.name

FROM customers AS c WHERE c.rating > 650

ORDER BY c.rating DESC),

"high-rated customers, ordered by zipcode":

(SELECT c.address.zipcode, c.custid, c.name

FROM customers AS c WHERE c.rating > 650

ORDER BY c.address.zipcode)

};

Result:

[

{ "high-rated customers, ordered by rating":

[ { "rating": 750, "custid": "C13", "name": "T. Cruise" },

{ "rating": 750, "custid": "C37", "name": "T. Hanks" },

{ "rating": 690, "custid": "C25", "name": "M. Streep" }

"high-rated customers, ordered by zipcode":

[ { "zipcode": "02115", "custid": "C37", "name": "T. Hanks" },

{ "zipcode": "02340", "custid": "C25", "name": "M. Streep" },

{ "zipcode": "63101", "custid": "C13", "name": "T. Cruise" }

]

}

]

GROUPING, AGGREGATION e UNNEST

O SQL++ suporta o mesmo conceito SQL de agrupamento e agregação. O UNNEST pega o conteúdo de arrays aninhados, ou seja, pedidos, e os une ao seu objeto pai, ou seja, clientes.

(Q6) Liste o primeiro pedido por número de pedido e número de item, juntamente com a quantidade total de todos os pedidos feitos em 2017-05-01.

SELECT   o.orderno, 
         i.itemno AS item_number,
         sum(i.qty) AS quantity
FROM orders AS o 
  UNNEST o.items AS i
WHERE o.order_date = "2017-05-01"
  GROUP BY o.orderno, i.itemno 
  ORDER BY o.orderno, item_number
LIMIT 1;
Result:
[
  {
    "orderno": 1002,
    "item_number": 460,
    "quantity": 95
  }
]

SELECT o.orderno,

i.itemno AS item_number,

sum(i.qty) AS quantity

FROM orders AS o

UNNEST o.items AS i

WHERE o.order_date = "2017-05-01"

GROUP BY o.orderno, i.itemno

ORDER BY o.orderno, item_number

LIMIT 1;

Result:

[

{

"orderno": 1002,

"item_number": 460,

"quantity": 95

}

]

GRUPO COMO

Uma consulta pode gerar dados de saída em nível de resumo. A definição do nível é fornecida na cláusula GROUP BY. A consulta Q6 gera um resumo de pedidos no nível do número do pedido e do número do item do pedido. Muitas vezes, você desejará gerar uma saída que inclua dados de resumo e itens de linha nos resumos. Para essa finalidade, o SQL++ oferece suporte a várias extensões importantes dos recursos de agrupamento tradicionais do SQL. As cláusulas GROUP BY e HAVING, já conhecidas, ainda estão presentes e são unidas por uma nova cláusula chamada GROUP AS.

(Q7) Liste todos os pedidos por número de pedido e número de item, juntamente com a quantidade total de todos os pedidos feitos em 01/05/2017, incluindo também todos os pedidos e itens de pedido feitos para cada linha de resumo. (Compare com a Q6)

SELECT   o.orderno, 
         i.itemno AS item_number,
         sum(i.qty) AS quantity,
         od
FROM orders AS o 
  UNNEST o.items AS i
WHERE o.order_date = "2017-05-01"
  GROUP BY o.orderno, i.itemno 
  GROUP AS od
LIMIT 1;

Result:
[
  {
    "od": [
      {
        "o": {
          "custid": "C13",
          "items": [
            {
              "itemno": 460,
              "price": 100.99,
              "qty": 95
            },
            {
              "itemno": 680,
              "price": 8.75,
              "qty": 150
            }
          ],
          "order_date": "2017-05-01",
          "orderno": 1002,
          "ship_date": "2017-05-03"
        },
        "i": {
          "itemno": 460,
          "price": 100.99,
          "qty": 95
        }
      }
    ],
    "orderno": 1002,
    "item_number": 460,
    "quantity": 95
  }
]

SELECT o.orderno,

i.itemno AS item_number,

sum(i.qty) AS quantity,

FROM orders AS o

UNNEST o.items AS i

WHERE o.order_date = "2017-05-01"

GROUP BY o.orderno, i.itemno

GROUP AS od

LIMIT 1;

Result:

[

{

"od": [

{

"o": {

"custid": "C13",

"items": [

{

"itemno": 460,

"price": 100.99,

"qty": 95

{

"itemno": 680,

"price": 8.75,

"qty": 150

}

"order_date": "2017-05-01",

"orderno": 1002,

"ship_date": "2017-05-03"

"i": {

"itemno": 460,

"price": 100.99,

"qty": 95

}

"orderno": 1002,

"item_number": 460,

"quantity": 95

}

]

Binh Le

Compartilhe este artigo

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

Uma implementação do SQL++

Resumo

Visão geral

Histórico

Aplicativos

Livros

Exemplos

SELECIONAR E SELECIONAR VALOR

GROUPING, AGGREGATION e UNNEST

GRUPO COMO

Receba atualizações do blog do Couchbase em sua caixa de entrada

Autor

Postado por Binh Le

Deixe um comentário Cancelar resposta

Pronto para começar a usar o Couchbase Capella?

Iniciar a construção

Use o Capella gratuitamente

Entre em contato