What is the Couchbase Primary Index? Learn Primary Uses

Un par de preguntas frecuentes sobre N1QL para el servicio de consultas:

¿Cuándo se utiliza realmente un índice primario?
¿Por qué la index advisor no recomienda el índice primario cuando esa puede ser la única opción?

Sigue leyendo...

Couchbase es una base de datos distribuida. Soporta un modelo de datos flexible usando JSON. Cada documento en un bucket tendrá una clave de documento única generada por el usuario. Esta unicidad se aplica durante la inserción o actualización de los datos. He aquí un documento de ejemplo.



select meta().id, travel
from `travel-sample` travel
where type = 'airline' limit 1;
[
  {
      "id": "airline_10",
      "travel": {
          "callsign": "MILE-AIR",
          "country": "United States",
          "iata": "Q5",
          "icao": "MLA",
          "id": 10,
          "name": "40-Mile Air",
          "type": "airline"
          }
      }
  ]

select meta().id, travel

from `travel-sample` travel

where type = 'airline' limit 1;

[

{

"id": "airline_10",

"travel": {

"callsign": "MILE-AIR",

"country": "United States",

"iata": "Q5",

"icao": "MLA",

"id": 10,

"name": "40-Mile Air",

"type": "airline"

}

]



INSERT INTO customer (key, value) VALUES(“cx:123”, {“name”:”joe”, “zip”: 94040, “state”:ca});

SELECT META().id FROM customer;

cx:123

INSERT INTO customer (key, value) VALUES(“cx:123”, {“name”:”joe”, “zip”: 94040, “state”:ca});

SELECT META().id FROM customer;

cx:123

Cada bucket de Couchbase puede almacenar datos de varios tipos: cliente, pedido, catálogo, etc. Al cargar el conjunto de datos "travel-sample", se cargan cinco tipos distintos de documentos: aerolínea, aeropuerto, hotel, ruta, puntos de referencia.

Pero, por defecto, Couchbase no tiene el equivalente de "escaneo de tabla completa" para escanear todos los documentos de principio a fin. El escaneo del índice primario te proporciona el equivalente al "escaneo de tabla completa".

CREATE PRIMARY INDEX ix_customer_primary ON customer;

¿Qué es el índice primario?

- una lista ordenada de todas las claves de documentos de cada tipo de documento dentro del bucket cliente.
- se mantiene de forma asíncrona, al igual que otros índices secundarios
- guarda sólo la clave del documento y nada más
- admite todas las consistencias de escaneado:
  - Sin límites
  - AT_PLUS
  - SOLICITUD_PLUS

El índice primario permite al motor de consulta acceder a todos los documentos y realizar sobre ellos las operaciones de filtrado, unión, agregación, etc.

EXPLAIN SELECT * from cliente WHERE código postal = 94040 nombre = "joe" y tipo = "cx";

Esto es lento. Muy lento. Obtención innecesaria de documentos; filtrado innecesario. Desperdicio de memoria y CPU. Los escaneos primarios recuperarán TODOS los documentos de todos los tipos en el bucket, independientemente de si su consulta finalmente los devuelve al usuario o no. Aunque he dicho que el escaneo primario es como un escaneo de tabla, es mucho más lento que el escaneo de tabla ya que tiene que escanear todos los documentos de todos los tipos.

No debe utilizar índices primarios. No los utilice. Especialmente en producción.

Entonces, ¿para qué tenemos índices primarios, para empezar?

Cuando esté empezando a jugar con nuevos datos de muestra, puede ejecutar la mayoría de las consultas sin preocuparse de crear índices específicos. En este punto, tu principal preocupación es comprender los datos en lugar de ajustar el rendimiento.
Cuando conozca el rango de claves primarias que desea escanear.
1. WHERE META().id between “cx:123” and “cx:458”
Cuando conozca el siguiendo META().id como el siguiente
1. WHERE META().id LIKE “cx:1%”
2. NO utilice: COMO "%:123". Esto resultará en un escaneo completo
Si conoce el META().id completo o la lista de META().id, puede utilizar USE KEYS para obtener directamente el documento sin consultar el índice primario.
1. FROM customer USE KEYS [“cx:123”]
2. FROM customer USE KEYS [“cx:123”, “cx:359”, “cx:948”]
3. FROM customer USE KEYS (SELECT raw docid FROM mylist WHERE zip = 94501)

Índice primario

crear el índice primario sobre 'muestra-viaje';

El índice primario es simplemente el índice de la clave de documento de todo el bucket. La capa de datos de Couchbase impone la restricción de unicidad en la clave del documento. El índice primario, como cualquier otro índice en Couchbase, se mantiene de forma asíncrona. El índice primario se mantiene de forma asíncrona. nivel de coherencia para su consulta.

Estos son los metadatos de este índice:


select * from system:indexes where name = ‘#primary’;
"indexes": {
  "datastore_id": "https://127.0.0.1:8091",
  "id": "f6e3c75d6f396e7d",
  "index_key": [],
  "is_primary": true,
  "keyspace_id": "travel-sample",
  "name": "#primary",
  "namespace_id": "default",
  "state": "online",
  "using": "gsi"
  }

select * from system:indexes where name = ‘#primary’;

"indexes": {

"datastore_id": "https://127.0.0.1:8091",

"id": "f6e3c75d6f396e7d",

"index_key": [],

"is_primary": true,

"keyspace_id": "travel-sample",

"name": "#primary",

"namespace_id": "default",

"state": "online",

"using": "gsi"

}

Los metadatos proporcionan información adicional sobre el índice: Dónde reside el índice (datastore_id), su estado (state) y el método de indexación (using).
El índice primario se utiliza para escaneos de bucket completos (escaneos primarios) cuando la consulta no tiene ningún filtro (predicados) o no se puede utilizar ningún otro índice o ruta de acceso. En Couchbase, almacenas múltiples keyspaces (documentos de diferente tipo, clientes, pedidos, inventario, etc) en un único bucket. Por lo tanto, cuando se hace el escaneo primario, la consulta utilizará el índice para obtener las claves de los documentos y obtener todos los documentos en el cubo y luego aplicar el filtro. Esto es MUY CARO.

El diseño de la clave de documento es algo así como el diseño de la clave primaria con múltiples partes.

Lastname:firstname:customerid

Example: smith:john:X1A1849

En Couchbase, es una buena práctica prefijar la clave con el tipo de documento. Dado que se trata de un documento de cliente, vamos a prefijar con CX. Ahora, la clave se convierte en:

Example: CX:smith:john:X1A1849

1	Example: CX:smith:john:X1A1849

Así que, en el mismo cubo, habrá otros tipos de documentos.

ORDERS type:  OD:US:CA:294829

1	ORDERS type: OD:US:CA:294829

ITEMS    type:   IT:KD93823

1	ITEMS type: IT:KD93823

Estas son simplemente las mejores prácticas. No hay ninguna restricción en el formato o la estructura de la clave del documento en Couchbase, excepto que tienen que ser únicos dentro de un cubo.

Ahora, si tienes documentos con varias claves y tienes un índice primario, puedes utilizar las siguientes consultas para hacerlo de forma eficiente.

Ejemplo 1: Búsqueda de una clave de documento específica.


SELECT * FROM  sales WHERE META().id = “CX:smith:john:X1A1849”;

      {
        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "exact": true,
            "range": [
              {
                "high": "\"CX:smith:john:X1A1849\"",
                "inclusion": 3,
                "low": "\"CX:smith:john:X1A1849\""
              }
            ]
          }
        ],

SELECT * FROM sales WHERE META().id = “CX:smith:john:X1A1849”;

{

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"CX:smith:john:X1A1849\"",

"inclusion": 3,

"low": "\"CX:smith:john:X1A1849\""

}

]

}

Si conoce la clave completa del documento, puede utilizar la siguiente sentencia y evitar por completo el acceso al índice.

SELECT * FROM sales USE KEYS [“CX:smith:john:X1A1849”]

Puede obtener más de un documento en una declaración.

SELECT * FROM sales USE KEYS [“CX:smith:john:X1A1849”, “CX:smithjr:john:X2A1492”]

1	SELECT * FROM sales USE KEYS [“CX:smith:john:X1A1849”, “CX:smithjr:john:X2A1492”]

Ejemplo 2: Busque un patrón. Consigue TODOS los documentos del cliente.


SELECT * FROM  sales WHERE META().id LIKE “CX:%”;
      {
        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "exact": true,
            "range": [
              {
                "high": "\"CX;\"",
                "inclusion": 1,
                "low": "\"CX:\""
              }
            ]
          }
        ],

SELECT * FROM sales WHERE META().id LIKE “CX:%”;

{

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"CX;\"",

"inclusion": 1,

"low": "\"CX:\""

}

]

}

Ejemplo 3: Consigue a todos los clientes que se apelliden Smith.

La siguiente consulta utiliza el índice primario de forma eficiente, obteniendo únicamente los clientes con un rango determinado. Nota: Este escaneo distingue entre mayúsculas y minúsculas. Para realizar una búsqueda sin distinguir mayúsculas de minúsculas, debe crear un índice secundario con UPPER() o LOWER() de la clave del documento.


SELECT * FROM  sales WHERE META().id LIKE "CX:smith%";

      {
        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "exact": true,
            "range": [
              {
                "high": "\"CX:smiti\"",
                "inclusion": 1,
                "low": "\"CX:smith\""
              }
            ]
          }
        ],

SELECT * FROM sales WHERE META().id LIKE "CX:smith%";

{

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"CX:smiti\"",

"inclusion": 1,

"low": "\"CX:smith\""

}

]

}

Ejemplo 4: Es habitual que algunas aplicaciones utilicen la dirección de correo electrónico como parte de la clave del documento, ya que son únicas. En ese caso, es necesario averiguar todos los clientes con gmail.com. Si este es un requisito típico, entonces, almacene el REVERSO de la dirección de correo electrónico como la clave y simplemente haga el escaneo del patrón de cadena líder.

Email:johnsmith@gmail.com;   key: reverse("johnsmith@gmail.com") => moc.liamg@htimsnhoj

Email: janesnow@yahoo.com  key: reverse("janesnow@yahoo.com") => moc.oohay@wonsenaj


SELECT *
FROM  sales
WHERE meta().id LIKE (reverse("@yahoo.com") || "%");

        "#operator": "IndexScan2",
        "index": "#primary",
        "index_id": "4c92ab0bcca9690a",
        "keyspace": "sales",
        "namespace": "default",
        "spans": [
          {
            "range": [
              {
                "high": "\"moc.oohayA\"",
                "inclusion": 1,
                "low": "\"moc.oohay@\""
              }
            ]
          }
        ],

SELECT *

FROM sales

WHERE meta().id LIKE (reverse("@yahoo.com") || "%");

"#operator": "IndexScan2",

"index": "#primary",

"index_id": "4c92ab0bcca9690a",

"keyspace": "sales",

"namespace": "default",

"spans": [

{

"range": [

{

"high": "\"moc.oohayA\"",

"inclusion": 1,

"low": "\"moc.oohay@\""

}

]

}

Índice primario con nombre

En Couchbase 5.0, puedes crear múltiples réplicas de cualquier índice con un simple parámetro a CREATE INDEX. A continuación se crearán 3 copias del índice y tiene que haber un mínimo de 3 nodos de índice en el clúster.

CREATE PRIMARY INDEX ON 'travel-sample' WITH {"num_replica":2}; 
CREATE PRIMARY INDEX `def_primary` ON `travel-sample` ;

1 2	CREATE PRIMARY INDEX ON 'travel-sample' WITH {"num_replica":2}; CREATE PRIMARY INDEX `def_primary` ON `travel-sample` ;

También puede asignar un nombre al índice primario. El resto de las características del índice primario son las mismas, excepto el nombre del índice. Un buen efecto secundario de esto es que puedes tener múltiples índices primarios en versiones de Couchbase anteriores a la 5.0 usando diferentes nombres. Los índices duplicados ayudan a la alta disponibilidad así como a la distribución de la carga de consultas a través de ellos. Esto es cierto tanto para los índices primarios como para los secundarios.


select meta().id as documentkey, `travel-sample` airline
from `travel-sample`
where type = 'airline' limit 1;
{
  "airline": {
    "callsign": "MILE-AIR",
    "country": "United States",
    "iata": "Q5",
    "icao": "MLA",
    "id": 10,
    "name": "40-Mile Air",
    "type": "airline"
  },
  "documentkey": "airline_10"
}

select meta().id as documentkey, `travel-sample` airline

from `travel-sample`

where type = 'airline' limit 1;

{

"airline": {

"callsign": "MILE-AIR",

"country": "United States",

"iata": "Q5",

"icao": "MLA",

"id": 10,

"name": "40-Mile Air",

"type": "airline"

"documentkey": "airline_10"

}

Finalmente, en Couchbase 6.5, hemos introducido el Index advisor. Puede analizar una única sentencia N1QL o carga de trabajo. Lee los detalles en:

Este asesor de índices sólo aconseja índices secundarios adecuados y nunca un índice primario. Si has leído el artículo hasta ahora, ¡ya sabes por qué! Descargar Couchbase 6.5 y ¡prueba todas las novedades!

Keshav Murthy

Comparte este artículo

2 Comentarios

AV25242 marzo 14, 2020 a 11:28 pm

¡¡¡Muy buen artículo, te mantuviste en el tema y fue muy fácil de seguir genial !!!

Un par de preguntas,

Como la mayoría de SQL ¿por qué no se crea un índice primario por defecto en couchbase en la columna type si existe?

¿Crear varios índices "con nombre" del mismo tipo y combinación (Primario / GSI) es una buena práctica teniendo en cuenta la compensación de costes?

Inicia sesión para responder
amit.kulkarni@sacumen.com abril 22, 2020 a 3:09 am

Hola Keshav,

Espero que estéis bien@ en estos tiempos difíciles.
Gracias por este magnífico artículo.
Sólo tengo una pregunta, ¿hay alguna otra manera, para recuperar el ID del documento sin utilizar índices y vistas, si no sabemos el ID del documento de antemano. Por favor, hágamelo saber.
Saludos cordiales,
Amit.

Inicia sesión para responder

Deja un comentario Cancelar respuesta

Lo siento, debes estar conectado para publicar un comentario.

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

Usos principales del índice primario de Couchbase

Índice primario

Índice primario con nombre

Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada

Autor

Publicado por Keshav Murthy

2 Comentarios

Deja un comentario Cancelar respuesta

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Utilizar Capella gratis

Póngase en contacto