Flexible Query & Indexing for Flexible JSON Model.

Utilice N1QL cuando se encuentre en un aprieto JSON. - Confucio

Para el modelo de datos JSON, el consejo es pensar en las colecciones como tablas, el documento JSON como filas desnormalizadas y los nombres de campo como columnas - a grandes rasgos. Todo esto es válido en bases de datos como Couchbase y MongoDB cuando se siguen estrictamente las recomendaciones. Hay muchas razones por las que los usuarios no se limitan a seguir este modelo de par clave-valor todo el tiempo. He aquí las principales razones.

1. JSON es demasiado verboso.
2. Desea convertir una estructura de datos map/hashmap en la que las claves son dinámicas.
3. Datos de series temporales cuando los nombres de los campos suelen ser marcas de tiempo codificadas.
4. Codificación basada en diccionarios
5. Los formatos y normas existentes no permiten el rediseño.

Si su base de datos y su lenguaje de consulta el lenguaje de consulta no se ocupan de la situación, tendrá que pasar por un elaborado rediseño. Además de simplemente acceder a la información, cómo hacer que las consultas sobre JSON sean eficientes cuando ¿ni siquiera sabes el nombre del campo que tienes que indexar? Afortunadamente, Couchbase N1QL tiene una variedad de características de consulta e índice para tratar también con metadatos flexibles.

Consideremos estos casos de uso.

Caso práctico 1: Transformación del valor.

He aquí un ejemplo de documento JSON.

{
    "cname": "Jane Smith",
    "dob" : "1990-01-30",
    "phones" : [
    "+1 510-523-3529", "+1 650-392-4923"
    ],
    "billing": [
      {
        "type": "visa",
        "cardnum": "5827-2842-2847-3909",
        "expiry": "2019-03"
      }, 
      {
        "type": "master",
        "cardnum": "6274-2542-5847-3949",
        "expiry": "2018-12"
      }
    ]
}

{

"cname": "Jane Smith",

"dob" : "1990-01-30",

"phones" : [

"+1 510-523-3529", "+1 650-392-4923"

"billing": [

{

"type": "visa",

"cardnum": "5827-2842-2847-3909",

"expiry": "2019-03"

{

"type": "master",

"cardnum": "6274-2542-5847-3949",

"expiry": "2018-12"

}

]

}

El modelo de datos JSON se describe simplemente como un conjunto de pares clave-valor. Cada clave es una cadena, única en su nivel jerárquico, y los valores pueden ser escalares, objetos o matrices. Una definición rigurosa puede leerse aquí. JSON también es autodescriptivo y eso lo hace flexible para un modelo de documento de base de datos. No todos los clientes tienen que tener un número fijo de números de teléfono o coches o cualquier otro tipo de atributos.

La misma información anterior se puede reorganizar como el JSON a continuación sin pérdida de información, pero algunos sche implícita



{
    "Jane Smith": "1990-01-30",
    "home": "+1 510-523-3529",
    "office": "+1 650-392-4923",
    "Billing": [
      {
        "visa": "5827-2842-2847-3909",
        "expiry": "2019-03"
      }, 
      {
        "master": "6274-2542-5847-3949",
        "expiry": "2018-12"
      }
    ]
}

{

"Jane Smith": "1990-01-30",

"home": "+1 510-523-3529",

"office": "+1 650-392-4923",

"Billing": [

{

"visa": "5827-2842-2847-3909",

"expiry": "2019-03"

{

"master": "6274-2542-5847-3949",

"expiry": "2018-12"

}

]

}

Esto está muy bien si simplemente estás poniendo y fijando el documento. No importa lo que la estructura de JSON. Simplemente schlep es de ida y vuelta.

Veamos ahora cómo afecta esto a las consultas.

Q1: SELECT * FROM customers WHERE cxname = “Jane Smith”;

Con el nuevo modelo JSON, no existe un nombre de campo llamado cxnombre aquí.


Q2: SELECT p FROM people p 
WHERE ANY o IN object_names(p) SATISFIES o = "Jane Smith" END

Q2: SELECT p FROM people p

WHERE ANY o IN object_names(p) SATISFIES o = "Jane Smith" END

Cuál es la magia de pares_objetos() ¿función? Transforma los pares JSON {"key": "value"} en una matriz de pares nombre-valor. He aquí un ejemplo.


SELECT OBJECT_NAMES({"Jane Smith": "1990-01-30", "home": "+1 510-523-3529"})

    "$1": [
      "Jane Smith",
      "home"
    ]
  }

SELECT OBJECT_NAMES({"Jane Smith": "1990-01-30", "home": "+1 510-523-3529"})

"$1": [

"Jane Smith",

"home"

]

}

La función OBJECT_NAMES() extrae la clave (en este caso "Jane Smith") y la devuelve como valor, que puede ser indexado. Dado que la función no devuelve un único valor, sino una matriz de "nombres de clave" como valores, es necesario crear un índice de matriz. Las consultas Q1 y Q2 hacen el mismo trabajo para el modelo de datos respectivo. Pero necesitamos que cada una de esas consultas se ejecute en milisegundos.

Para Q1, simplemente creamos el índice sobre cxname.

CREATE INDEX ix_cxname ON customers(cxname)

Para la Q2,

CREATE INDEX ix_people ON people(DISTINCT OBJECT_NAMES(self))

Con este índice, para Q2, obtendrá un plan que utiliza el índice.


        {
            "#operator": "DistinctScan",
            "scan": {
                "#operator": "IndexScan3",
                "as": "p",
                "cardinality": 1,
                "cost": 0.273,
                "index": "ix_people",
                "index_id": "4a2df8dd85543aa4",
                "index_projection": {
                    "primary_key": true
                },
                "keyspace": "people",
                "namespace": "default",
                "spans": [
                    {
                        "exact": true,
                        "range": [
                            {
                                "high": "\"Jane Smith\"",
                                "inclusion": 3,
                                "low": "\"Jane Smith\""
                            }
                        ]
                    }
                ],

{

"#operator": "DistinctScan",

"scan": {

"#operator": "IndexScan3",

"as": "p",

"cardinality": 1,

"cost": 0.273,

"index": "ix_people",

"index_id": "4a2df8dd85543aa4",

"index_projection": {

"primary_key": true

"keyspace": "people",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"Jane Smith\"",

"inclusion": 3,

"low": "\"Jane Smith\""

}

]

}

Caso de uso 2: Nombres de claves dinámicas.

Este caso de uso se ha extraído del Couchbase puesto del foro.



{
    "id": "05a9b954-bdee-4d7f-9715-8e9e08f8cb75",
    "type": "article",
    "translations": {
        "en": "Hello",
        "de": "Hallo", 
        "fr": "Bonjour",
        "es": "Hola"
    }
}

{

"id": "05a9b954-bdee-4d7f-9715-8e9e08f8cb75",

"type": "article",

"translations": {

"en": "Hello",

"de": "Hallo",

"fr": "Bonjour",

"es": "Hola"

}

Pregunta: ¿Cuál sería la mejor manera de indexar los valores dentro de traducciones dinámicamente? Es decir, un índice genérico que indexe todas las claves dentro del traducciones objeto.

Si la necesidad es simplemente consultar documentos en inglés todo el tiempo, para consultar todos los documentos que tienen translations.es = "Hola".

Si siempre está buscando traducciones al inglés, puede crear simplemente el índice en transactions.es.


CREATE INDEX ix_tren ON info(translations.en);
SELECT * FROM info WHERE translation.en = “Hello”;

CREATE INDEX ix_tren ON info(translations.en);

SELECT * FROM info WHERE translation.en = “Hello”;

Si las claves son dinámicas, no sabes qué idioma concreto va a haber en los datos y cuáles pueden ser objeto de consulta, tienes que hacer que ambas sean dinámicas.


/* Query */
SELECT *
FROM info
    WHERE  ANY v IN OBJECT_PAIRS(translations) 
            SATISFIES [v.name,v.val] = ["en", "Hello"] 
        END

/* Index */
CREATE INDEX ix_infoname ON info (
    DISTINCT ARRAY [v.name, v.val ]
    FOR v IN OBJECT_PAIRS(translations) END
)

/* Query */

SELECT *

FROM info

WHERE ANY v IN OBJECT_PAIRS(translations)

SATISFIES [v.name,v.val] = ["en", "Hello"]

END

/* Index */

CREATE INDEX ix_infoname ON info (

DISTINCT ARRAY [v.name, v.val ]

FOR v IN OBJECT_PAIRS(translations) END

)

Aquí está la explicación para verificar que el índice es efectivamente recogido y los predicados son empujados hacia abajo a la exploración del índice.



        {
            "#operator": "DistinctScan",
            "scan": {
                "#operator": "IndexScan3",
                "cardinality": 0.5,
                "cost": 0.1665,
                "index": "ix_infoname",
                "index_id": "bebbfd22a022fb75",
                "index_projection": {
                    "primary_key": true
                },
                "keyspace": "info",
                "namespace": "default",
                "spans": [
                    {
                        "exact": true,
                        "range": [
                            {
                                "high": "[\"en\", \"Hello\"]",
                                "inclusion": 3,
                                "low": "[\"en\", \"Hello\"]"
                            }
                        ]
                    }
                ],
                "using": "gsi"
            }
        },

{

"#operator": "DistinctScan",

"scan": {

"#operator": "IndexScan3",

"cardinality": 0.5,

"cost": 0.1665,

"index": "ix_infoname",

"index_id": "bebbfd22a022fb75",

"index_projection": {

"primary_key": true

"keyspace": "info",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "[\"en\", \"Hello\"]",

"inclusion": 3,

"low": "[\"en\", \"Hello\"]"

}

]

}

"using": "gsi"

}

No se preocupe si la definición del índice le parece un poco más complicada de lo normal. El Index Advisor lo tiene todo cubierto.



ADVISE SELECT * 
       FROM info 
       WHERE ANY v IN OBJECT_PAIRS(translations) 
                 SATISFIES [v.name,v.val] = ["en", "Hello"] 
       END


{
    "index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_name_val ON `info`(DISTINCT ARRAY [`v`.`name`, `v`.`val`] FOR v in object_pairs((`translations`)) END)",
    "keyspace_alias": "info",
    "recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."
}

ADVISE SELECT *

FROM info

WHERE ANY v IN OBJECT_PAIRS(translations)

SATISFIES [v.name,v.val] = ["en", "Hello"]

END

{

"index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_name_val ON `info`(DISTINCT ARRAY [`v`.`name`, `v`.`val`] FOR v in object_pairs((`translations`)) END)",

"keyspace_alias": "info",

"recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."

}

Incluso puedes añadir expresiones encima de cada expresión que estés evaluando.



ADVISE SELECT * 
       FROM info 
       WHERE ANY v IN OBJECT_PAIRS(translations) 
                 SATISFIES [LOWER(v.name),LOWER(v.val)] = ["en", "Hello"] 
       END


{
      "index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_lower_name_lower_val ON `info`(DISTINCT ARRAY [lower((`v`.`name`)), lower((`v`.`val`))] FOR v in object_pairs((`translations`)) END)",
      "keyspace_alias": "info",
      "recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."
}

ADVISE SELECT *

FROM info

WHERE ANY v IN OBJECT_PAIRS(translations)

SATISFIES [LOWER(v.name),LOWER(v.val)] = ["en", "Hello"]

END

{

"index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_lower_name_lower_val ON `info`(DISTINCT ARRAY [lower((`v`.`name`)), lower((`v`.`val`))] FOR v in object_pairs((`translations`)) END)",

"keyspace_alias": "info",

"recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."

}

Más funciones de objeto

N1QL dispone de objeto y funciones de datos anidados para ayudar con modelos de datos complejos. Echa un vistazo al conjunto completo de funciones de objeto y a la sección funciones simbólicas.

Referencias:

Funciones de objeto Couchbae N1QL Documentación
Couchbase Indexación de matrices
Couchbase índice blog

Keshav Murthy

Comparte este artículo

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

Consulta e indexación flexibles para un modelo JSON flexible.

Utilice N1QL cuando se encuentre en un aprieto JSON. - Confucio

Caso práctico 1: Transformación del valor.

Caso de uso 2: Nombres de claves dinámicas.

Más funciones de objeto

Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada

Autor

Publicado por Keshav Murthy

Deja un comentario Cancelar respuesta

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Utilizar Capella gratis

Póngase en contacto