What is the Couchbase Primary Index? Learn Primary Uses

Algumas perguntas frequentes sobre o N1QL para serviço de consulta:

Quando é que realmente usamos um índice primário?
Por que a o consultor de índices não recomenda o índice primário quando essa pode ser a única opção?

Continue lendo...

O Couchbase é um banco de dados distribuído. Ele suporta um modelo de dados flexível usando JSON. Cada documento em um bucket terá uma chave de documento exclusiva gerada pelo usuário. Essa exclusividade é imposta durante a inserção ou atualização dos dados. Aqui está um exemplo de documento.



select meta().id, travel
from `travel-sample` travel
where type = 'airline' limit 1;
[
  {
      "id": "airline_10",
      "travel": {
          "callsign": "MILE-AIR",
          "country": "United States",
          "iata": "Q5",
          "icao": "MLA",
          "id": 10,
          "name": "40-Mile Air",
          "type": "airline"
          }
      }
  ]

select meta().id, travel

from `travel-sample` travel

where type = 'airline' limit 1;

[

{

"id": "airline_10",

"travel": {

"callsign": "MILE-AIR",

"country": "United States",

"iata": "Q5",

"icao": "MLA",

"id": 10,

"name": "40-Mile Air",

"type": "airline"

}

]



INSERT INTO customer (key, value) VALUES(“cx:123”, {“name”:”joe”, “zip”: 94040, “state”:ca});

SELECT META().id FROM customer;

cx:123

INSERT INTO customer (key, value) VALUES(“cx:123”, {“name”:”joe”, “zip”: 94040, “state”:ca});

SELECT META().id FROM customer;

cx:123

Cada bucket do Couchbase pode armazenar dados de vários tipos: cliente, pedido, catálogo etc. Ao carregar o conjunto de dados "travel-sample", você carrega cinco tipos distintos de documentos: companhia aérea, aeroporto, hotel, rota, pontos de referência.

Mas, por padrão, o Couchbase não tem o equivalente à "varredura de tabela completa" para varrer todos os documentos do início ao fim. A varredura de índice primário fornece a você o equivalente à "varredura de tabela completa".

CREATE PRIMARY INDEX ix_customer_primary ON customer;

O que é o índice primário?

- uma lista ordenada de todas as chaves de documento de cada tipo de documento dentro do bucket do cliente.
- mantidos de forma assíncrona, assim como outros índices secundários
- mantém apenas a chave do documento e nada mais
- suporta todas as consistências de varredura:
  - Não limitado
  - AT_PLUS
  - REQUEST_PLUS

O índice primário permite que o mecanismo de consulta acesse todos os documentos e, em seguida, faça as operações de filtragem, junção, agregação etc. sobre eles.

EXPLAIN SELECT * from customer WHERE zip = 94040 name name = "joe" and type = "cx";

Isso é lento. Muito lento. Buscas desnecessárias de documentos; filtragem desnecessária. Desperdício de memória e CPU. As varreduras primárias recuperarão TODOS os documentos de todos os tipos no bucket, independentemente de a consulta os retornar ou não ao usuário. Embora eu tenha dito que a varredura primária é como uma varredura de tabela, ela é muito mais lenta do que a varredura de tabela, pois precisa varrer todos os documentos de todos os tipos.

Você não deve usar índices primários. Não os utilize. Especialmente em produção.

Então, para começar, por que temos índices primários?

Quando estiver começando a trabalhar com novos dados de amostra, você poderá executar a maioria das consultas sem se preocupar em criar índices específicos. Nesse ponto, sua principal preocupação é entender os dados em vez de ajustar a taxa de transferência.
Quando você souber o intervalo de chaves primárias que deseja verificar.
1. WHERE META().id between “cx:123” and “cx:458”
Quando você conhece o no final META().id padrão como abaixo
1. WHERE META().id LIKE “cx:1%”
2. NÃO use: COMO "%:123". Isso resultará em uma varredura completa
Quando você souber o META().id completo ou a lista de META().id, poderá usar USE KEYS para buscar diretamente o documento sem consultar o índice primário
1. FROM customer USE KEYS [“cx:123”]
2. FROM customer USE KEYS [“cx:123”, “cx:359”, “cx:948”]
3. FROM customer USE KEYS (SELECT raw docid FROM mylist WHERE zip = 94501)

Índice primário

criar o índice primário em "travel-sample";

O índice primário é simplesmente o índice da chave do documento em todo o bucket. A camada de dados do Couchbase impõe a restrição de exclusividade na chave do documento. O índice primário, como qualquer outro índice no Couchbase, é mantido de forma assíncrona. Você define a recência dos dados configurando o parâmetro nível de consistência para sua consulta.

Aqui estão os metadados desse índice:


select * from system:indexes where name = ‘#primary’;
"indexes": {
  "datastore_id": "https://127.0.0.1:8091",
  "id": "f6e3c75d6f396e7d",
  "index_key": [],
  "is_primary": true,
  "keyspace_id": "travel-sample",
  "name": "#primary",
  "namespace_id": "default",
  "state": "online",
  "using": "gsi"
  }

select * from system:indexes where name = ‘#primary’;

"indexes": {

"datastore_id": "https://127.0.0.1:8091",

"id": "f6e3c75d6f396e7d",

"index_key": [],

"is_primary": true,

"keyspace_id": "travel-sample",

"name": "#primary",

"namespace_id": "default",

"state": "online",

"using": "gsi"

}

Os metadados fornecem informações adicionais sobre o índice: Onde o índice reside (datastore_id), seu estado (state) e o método de indexação (using).
O índice primário é usado para varreduras completas do bucket (varreduras primárias) quando a consulta não tem nenhum filtro (predicado) ou nenhum outro índice ou caminho de acesso pode ser usado. No Couchbase, você armazena vários espaços-chave (documentos de um tipo diferente, cliente, pedidos, estoque etc.) em um único bucket. Portanto, quando você fizer a varredura primária, a consulta usará o índice para obter as chaves do documento e buscará todos os documentos no bucket e, em seguida, aplicará o filtro. Portanto, isso é MUITO CARO.

O design da chave do documento é semelhante ao design da chave primária com várias partes.

Lastname:firstname:customerid

Example: smith:john:X1A1849

No Couchbase, é uma prática recomendada prefixar a chave com o tipo do documento. Como esse é um documento de cliente, vamos prefixar com CX. Agora, a chave se torna:

Example: CX:smith:john:X1A1849

1	Example: CX:smith:john:X1A1849

Portanto, no mesmo balde, haverá outros tipos de documentos.

ORDERS type:  OD:US:CA:294829

1	ORDERS type: OD:US:CA:294829

ITEMS    type:   IT:KD93823

1	ITEMS type: IT:KD93823

Essas são apenas as práticas recomendadas. Não há restrições quanto ao formato ou à estrutura da chave do documento no Couchbase, exceto o fato de que ela deve ser exclusiva em um bucket.

Agora, se você tiver documentos com várias chaves e tiver um índice primário, poderá usar as seguintes consultas para obter eficiência.

Exemplo 1: Procurando uma chave de documento específica.


SELECT * FROM  sales WHERE META().id = “CX:smith:john:X1A1849”;

      {
        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "exact": true,
            "range": [
              {
                "high": "\"CX:smith:john:X1A1849\"",
                "inclusion": 3,
                "low": "\"CX:smith:john:X1A1849\""
              }
            ]
          }
        ],

SELECT * FROM sales WHERE META().id = “CX:smith:john:X1A1849”;

{

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"CX:smith:john:X1A1849\"",

"inclusion": 3,

"low": "\"CX:smith:john:X1A1849\""

}

]

}

Se você souber a chave completa do documento, poderá usar a instrução a seguir e evitar completamente o acesso ao índice.

SELECT * FROM sales USE KEYS [“CX:smith:john:X1A1849”]

É possível obter mais de um documento em uma declaração.

SELECT * FROM sales USE KEYS [“CX:smith:john:X1A1849”, “CX:smithjr:john:X2A1492”]

1	SELECT * FROM sales USE KEYS [“CX:smith:john:X1A1849”, “CX:smithjr:john:X2A1492”]

Exemplo 2: Procure um padrão. Obtenha TODOS os documentos do cliente.


SELECT * FROM  sales WHERE META().id LIKE “CX:%”;
      {
        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "exact": true,
            "range": [
              {
                "high": "\"CX;\"",
                "inclusion": 1,
                "low": "\"CX:\""
              }
            ]
          }
        ],

SELECT * FROM sales WHERE META().id LIKE “CX:%”;

{

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"CX;\"",

"inclusion": 1,

"low": "\"CX:\""

}

]

}

Exemplo 3: Obtenha todos os clientes com smith como sobrenome.

A consulta a seguir usa o índice primário de forma eficiente, buscando apenas os clientes com um intervalo específico. Observação: Essa varredura diferencia maiúsculas de minúsculas. Para fazer uma varredura sem distinção entre maiúsculas e minúsculas, você deve criar um índice secundário com UPPER() ou LOWER() da chave do documento.


SELECT * FROM  sales WHERE META().id LIKE "CX:smith%";

      {
        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "exact": true,
            "range": [
              {
                "high": "\"CX:smiti\"",
                "inclusion": 1,
                "low": "\"CX:smith\""
              }
            ]
          }
        ],

SELECT * FROM sales WHERE META().id LIKE "CX:smith%";

{

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"CX:smiti\"",

"inclusion": 1,

"low": "\"CX:smith\""

}

]

}

Exemplo 4: É comum que alguns aplicativos usem o endereço de e-mail como parte da chave do documento, pois eles são exclusivos. Nesse caso, você precisa descobrir todos os clientes com gmail.com. Se esse for um requisito típico, armazene o REVERSO do endereço de e-mail como a chave e simplesmente faça a verificação do padrão de cadeia de caracteres principal.

Email:johnsmith@gmail.com;   key: reverse("johnsmith@gmail.com") => moc.liamg@htimsnhoj

Email: janesnow@yahoo.com  key: reverse("janesnow@yahoo.com") => moc.oohay@wonsenaj


SELECT *
FROM  sales
WHERE meta().id LIKE (reverse("@yahoo.com") || "%");

        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "range": [
              {
                "high": "\"moc.oohayA\"",
                "inclusion": 1,
                "low": "\"moc.oohay@\""
              }
            ]
          }
        ],

SELECT *

FROM sales

WHERE meta().id LIKE (reverse("@yahoo.com") || "%");

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"range": [

{

"high": "\"moc.oohayA\"",

"inclusion": 1,

"low": "\"moc.oohay@\""

}

]

}

Índice primário nomeado

No Couchbase 5.0, você pode criar várias réplicas de qualquer índice com um simples parâmetro para CREATE INDEX. A seguir, serão criadas 3 cópias do índice e deve haver no mínimo 3 nós de índice no cluster.

CREATE PRIMARY INDEX ON 'travel-sample' WITH {"num_replica":2}; 
CREATE PRIMARY INDEX `def_primary` ON `travel-sample` ;

1 2	CREATE PRIMARY INDEX ON 'travel-sample' WITH {"num_replica":2}; CREATE PRIMARY INDEX `def_primary` ON `travel-sample` ;

Você também pode nomear o índice primário. O restante dos recursos do índice primário é o mesmo, exceto o nome do índice. Um bom efeito colateral disso é que você pode ter vários índices primários nas versões do Couchbase anteriores à 5.0 usando nomes diferentes. Os índices duplicados ajudam na alta disponibilidade, bem como na distribuição da carga de consulta entre eles. Isso é válido tanto para índices primários quanto para índices secundários.


select meta().id as documentkey, `travel-sample` airline
from `travel-sample`
where type = 'airline' limit 1;
{
  "airline": {
    "callsign": "MILE-AIR",
    "country": "United States",
    "iata": "Q5",
    "icao": "MLA",
    "id": 10,
    "name": "40-Mile Air",
    "type": "airline"
  },
  "documentkey": "airline_10"
}

select meta().id as documentkey, `travel-sample` airline

from `travel-sample`

where type = 'airline' limit 1;

{

"airline": {

"callsign": "MILE-AIR",

"country": "United States",

"iata": "Q5",

"icao": "MLA",

"id": 10,

"name": "40-Mile Air",

"type": "airline"

"documentkey": "airline_10"

}

Por fim, no Couchbase 6.5, introduzimos o consultor de índice. Ele pode analisar uma única instrução N1QL ou carga de trabalho. Leia os detalhes em:

Esse consultor de índices só aconselha índices secundários adequados e nunca um índice primário. Se você leu o artigo até agora, sabe por quê! Faça o download do Couchbase 6.5 e experimente todos os novos recursos!

Keshav Murthy

Compartilhe este artigo

2 Comentários

AV25242 março 14, 2020 em 11:28 pm

Artigo muito bom, você se manteve no tópico e foi muito fácil de acompanhar, ótimo!

Algumas perguntas,

Como na maioria dos SQL, por que um índice primário não é criado por padrão no couchbase na coluna type, se ela existir?

Criar vários índices "nomeados" do mesmo tipo e combinação (Primário/GSI) é uma boa prática, considerando a troca de custos?

Acesse para responder
amit.kulkarni@sacumen.com abril 22, 2020 em 3:09 am

Oi Keshav,

Espero que esteja bem nesses tempos difíceis.
Obrigado por esse artigo maravilhoso.
Só tenho uma pergunta: existe alguma outra maneira de recuperar o ID do documento sem usar índices e exibições, se não soubermos o ID do documento com antecedência? Por favor, me informe.
Com os melhores cumprimentos,
Amit.

Acesse para responder

Deixe um comentário Cancelar resposta

Você precisa fazer o login para publicar um comentário.

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

Principais usos do índice primário do Couchbase

Índice primário

Índice primário nomeado

Receba atualizações do blog do Couchbase em sua caixa de entrada

Autor

Postado por Keshav Murthy

2 Comentários

Deixe um comentário Cancelar resposta

Pronto para começar a usar o Couchbase Capella?

Iniciar a construção

Use o Capella gratuitamente

Entre em contato