Flexible Query & Indexing for Flexible JSON Model.

Use o N1QL quando estiver em uma situação difícil com o JSON. - Confúcio

Para o modelo de dados JSON, a recomendação é pensar nas coleções como tabelas, no documento JSON como linhas desnormalizadas e nos nomes de campo como colunas - aproximadamente. Tudo isso é válido em bancos de dados como o Couchbase e o MongoDB quando as recomendações são seguidas à risca. Há muitos motivos pelos quais os usuários não seguem simplesmente esse modelo de par de valores-chave o tempo todo. Aqui estão os principais motivos.

1. JSON é muito prolixo.
2. Você deseja converter uma estrutura de dados de mapa/hashmap em que as chaves são dinâmicas.
3. Dados de série temporal quando os nomes de campo são geralmente carimbos de data/hora codificados.
4. Codificação baseada em dicionário
5. Os formatos e padrões de documentos existentes não permitem o redesenho

Se o seu banco de dados e a linguagem de consulta não lidarem com a situação, você terá que passar por um redesenho elaborado. Além de simplesmente acessar as informações, Como você torna as consultas em JSON eficientes quando você não sabe nem mesmo o nome do campo que você precisa indexar? Felizmente, o Couchbase N1QL tem uma variedade de recursos de consulta e índice para lidar também com metadados flexíveis.

Vamos considerar esses casos de uso.

Caso de uso 1: transformação de valor.

Aqui está um exemplo de documento JSON.

{
    "cname": "Jane Smith",
    "dob" : "1990-01-30",
    "phones" : [
    "+1 510-523-3529", "+1 650-392-4923"
    ],
    "billing": [
      {
        "type": "visa",
        "cardnum": "5827-2842-2847-3909",
        "expiry": "2019-03"
      }, 
      {
        "type": "master",
        "cardnum": "6274-2542-5847-3949",
        "expiry": "2018-12"
      }
    ]
}

{

"cname": "Jane Smith",

"dob" : "1990-01-30",

"phones" : [

"+1 510-523-3529", "+1 650-392-4923"

"billing": [

{

"type": "visa",

"cardnum": "5827-2842-2847-3909",

"expiry": "2019-03"

{

"type": "master",

"cardnum": "6274-2542-5847-3949",

"expiry": "2018-12"

}

]

}

O modelo de dados JSON é descrito simplesmente como um conjunto de pares chave-valor. Cada chave é uma cadeia de caracteres, exclusiva naquele nível da hierarquia, e os valores podem ser escalares, objetos ou matrizes. Uma definição rigorosa pode ser lida aqui. O JSON também é autodescritivo, o que o torna flexível para um modelo de documento de banco de dados. Nem todo cliente precisa ter um número fixo de números de telefone, carros ou qualquer outro tipo de atributo.

As mesmas informações acima podem ser reorganizadas como o JSON abaixo sem perda de informações, mas alguns códigos implícitos



{
    "Jane Smith": "1990-01-30",
    "home": "+1 510-523-3529",
    "office": "+1 650-392-4923",
    "Billing": [
      {
        "visa": "5827-2842-2847-3909",
        "expiry": "2019-03"
      }, 
      {
        "master": "6274-2542-5847-3949",
        "expiry": "2018-12"
      }
    ]
}

{

"Jane Smith": "1990-01-30",

"home": "+1 510-523-3529",

"office": "+1 650-392-4923",

"Billing": [

{

"visa": "5827-2842-2847-3909",

"expiry": "2019-03"

{

"master": "6274-2542-5847-3949",

"expiry": "2018-12"

}

]

}

Isso é muito bom se você estiver simplesmente colocando e definindo o documento. Não importa qual seja a estrutura do JSON. Basta arrastar o documento para frente e para trás.

Agora, vamos ver como isso afeta a consulta.

Q1: SELECT * FROM customers WHERE cxname = “Jane Smith”;

Com o novo modelo JSON, não há um nome de campo chamado cxname aqui.


Q2: SELECT p FROM people p 
WHERE ANY o IN object_names(p) SATISFIES o = "Jane Smith" END

Q2: SELECT p FROM people p

WHERE ANY o IN object_names(p) SATISFIES o = "Jane Smith" END

O que a magia do object_pairs() function? Ela transforma os pares JSON {"key": "value"} em uma matriz de pares nome-valor. Veja um exemplo.


SELECT OBJECT_NAMES({"Jane Smith": "1990-01-30", "home": "+1 510-523-3529"})

    "$1": [
      "Jane Smith",
      "home"
    ]
  }

SELECT OBJECT_NAMES({"Jane Smith": "1990-01-30", "home": "+1 510-523-3529"})

"$1": [

"Jane Smith",

"home"

]

}

A função OBJECT_NAMES() extrai a chave (aqui "Jane Smith") e retorna como um valor, que pode ser indexado. Como a função retorna não apenas um valor, mas uma matriz de "nomes de chaves" como valores, você precisa criar um índice de matriz. As consultas Q1 e Q2 fazem o mesmo trabalho para o respectivo modelo de dados. Porém, precisamos que cada uma dessas consultas seja executada em milissegundos.

Para o Q1, simplesmente criamos o índice em cxname.

CREATE INDEX ix_cxname ON customers(cxname)

Para o Q2,

CREATE INDEX ix_people ON people(DISTINCT OBJECT_NAMES(self))

Com esse índice, para o Q2, você obterá um plano que usa o índice.


        {
            "#operator": "DistinctScan",
            "scan": {
                "#operator": "IndexScan3",
                "as": "p",
                "cardinality": 1,
                "cost": 0.273,
                "index": "ix_people",
                "index_id": "4a2df8dd85543aa4",
                "index_projection": {
                    "primary_key": true
                },
                "keyspace": "people",
                "namespace": "default",
                "spans": [
                    {
                        "exact": true,
                        "range": [
                            {
                                "high": "\"Jane Smith\"",
                                "inclusion": 3,
                                "low": "\"Jane Smith\""
                            }
                        ]
                    }
                ],

{

"#operator": "DistinctScan",

"scan": {

"#operator": "IndexScan3",

"as": "p",

"cardinality": 1,

"cost": 0.273,

"index": "ix_people",

"index_id": "4a2df8dd85543aa4",

"index_projection": {

"primary_key": true

"keyspace": "people",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "\"Jane Smith\"",

"inclusion": 3,

"low": "\"Jane Smith\""

}

]

}

Caso de uso 2: nomes de chaves dinâmicas.

Este caso de uso foi extraído do Couchbase post do fórum.



{
    "id": "05a9b954-bdee-4d7f-9715-8e9e08f8cb75",
    "type": "article",
    "translations": {
        "en": "Hello",
        "de": "Hallo", 
        "fr": "Bonjour",
        "es": "Hola"
    }
}

{

"id": "05a9b954-bdee-4d7f-9715-8e9e08f8cb75",

"type": "article",

"translations": {

"en": "Hello",

"de": "Hallo",

"fr": "Bonjour",

"es": "Hola"

}

Pergunta: Qual seria a melhor maneira de indexar os valores dentro de traduções dinamicamente? Ou seja, um índice genérico que indexa todas as chaves dentro do traduções objeto.

Se a necessidade for simplesmente consultar documentos em inglês o tempo todo, para consultar todos os documentos que tenham translations.en = "Hello" (Olá).

Se estiver sempre procurando por traduções para o inglês, basta criar o índice em transactions.en.


CREATE INDEX ix_tren ON info(translations.en);
SELECT * FROM info WHERE translation.en = “Hello”;

CREATE INDEX ix_tren ON info(translations.en);

SELECT * FROM info WHERE translation.en = “Hello”;

Se as chaves forem dinâmicas, você não sabe qual linguagem específica estará nos dados e quais podem ser consultadas, então é preciso torná-las dinâmicas.


/* Query */
SELECT *
FROM info
    WHERE  ANY v IN OBJECT_PAIRS(translations) 
            SATISFIES [v.name,v.val] = ["en", "Hello"] 
        END

/* Index */
CREATE INDEX ix_infoname ON info (
    DISTINCT ARRAY [v.name, v.val ]
    FOR v IN OBJECT_PAIRS(translations) END
)

/* Query */

SELECT *

FROM info

WHERE ANY v IN OBJECT_PAIRS(translations)

SATISFIES [v.name,v.val] = ["en", "Hello"]

END

/* Index */

CREATE INDEX ix_infoname ON info (

DISTINCT ARRAY [v.name, v.val ]

FOR v IN OBJECT_PAIRS(translations) END

)

Aqui está a explicação para verificar se o índice é de fato coletado e se os predicados são enviados para a varredura do índice.



        {
            "#operator": "DistinctScan",
            "scan": {
                "#operator": "IndexScan3",
                "cardinality": 0.5,
                "cost": 0.1665,
                "index": "ix_infoname",
                "index_id": "bebbfd22a022fb75",
                "index_projection": {
                    "primary_key": true
                },
                "keyspace": "info",
                "namespace": "default",
                "spans": [
                    {
                        "exact": true,
                        "range": [
                            {
                                "high": "[\"en\", \"Hello\"]",
                                "inclusion": 3,
                                "low": "[\"en\", \"Hello\"]"
                            }
                        ]
                    }
                ],
                "using": "gsi"
            }
        },

{

"#operator": "DistinctScan",

"scan": {

"#operator": "IndexScan3",

"cardinality": 0.5,

"cost": 0.1665,

"index": "ix_infoname",

"index_id": "bebbfd22a022fb75",

"index_projection": {

"primary_key": true

"keyspace": "info",

"namespace": "default",

"spans": [

{

"exact": true,

"range": [

{

"high": "[\"en\", \"Hello\"]",

"inclusion": 3,

"low": "[\"en\", \"Hello\"]"

}

]

}

"using": "gsi"

}

Não se preocupe se a definição do índice parecer um pouco mais complicada do que o normal. O Index Advisor o ajudará.



ADVISE SELECT * 
       FROM info 
       WHERE ANY v IN OBJECT_PAIRS(translations) 
                 SATISFIES [v.name,v.val] = ["en", "Hello"] 
       END


{
    "index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_name_val ON `info`(DISTINCT ARRAY [`v`.`name`, `v`.`val`] FOR v in object_pairs((`translations`)) END)",
    "keyspace_alias": "info",
    "recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."
}

ADVISE SELECT *

FROM info

WHERE ANY v IN OBJECT_PAIRS(translations)

SATISFIES [v.name,v.val] = ["en", "Hello"]

END

{

"index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_name_val ON `info`(DISTINCT ARRAY [`v`.`name`, `v`.`val`] FOR v in object_pairs((`translations`)) END)",

"keyspace_alias": "info",

"recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."

}

Você pode até mesmo adicionar expressões em cima de cada expressão que estiver avaliando.



ADVISE SELECT * 
       FROM info 
       WHERE ANY v IN OBJECT_PAIRS(translations) 
                 SATISFIES [LOWER(v.name),LOWER(v.val)] = ["en", "Hello"] 
       END


{
      "index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_lower_name_lower_val ON `info`(DISTINCT ARRAY [lower((`v`.`name`)), lower((`v`.`val`))] FOR v in object_pairs((`translations`)) END)",
      "keyspace_alias": "info",
      "recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."
}

ADVISE SELECT *

FROM info

WHERE ANY v IN OBJECT_PAIRS(translations)

SATISFIES [LOWER(v.name),LOWER(v.val)] = ["en", "Hello"]

END

{

"index_statement": "CREATE INDEX adv_DISTINCT_object_pairs_translations_lower_name_lower_val ON `info`(DISTINCT ARRAY [lower((`v`.`name`)), lower((`v`.`val`))] FOR v in object_pairs((`translations`)) END)",

"keyspace_alias": "info",

"recommending_rule": "Index keys follow order of predicate types: 2. equality/null/missing."

}

Mais funções de objeto

O N1QL tem mais objeto e funções de dados aninhadas para ajudar com modelos de dados complexos. Confira o conjunto completo de funções de objeto e a seção funções de token.

Referências:

Funções de objeto do Couchbae N1QL Documentação
Couchbase Indexação de matrizes
Couchbase blog de índice

Keshav Murthy

Compartilhe este artigo

Platform

Self-Managed

Services

Capabilities

By Use Case

By Industry

Popular Docs

Quickstart

Resource Center

About

Partnerships

Consulta e indexação flexíveis para o modelo JSON flexível.

Use o N1QL quando estiver em uma situação difícil com o JSON. - Confúcio

Caso de uso 1: transformação de valor.

Caso de uso 2: nomes de chaves dinâmicas.

Mais funções de objeto

Receba atualizações do blog do Couchbase em sua caixa de entrada

Autor

Postado por Keshav Murthy

Deixe um comentário Cancelar resposta

Pronto para começar a usar o Couchbase Capella?

Iniciar a construção

Use o Capella gratuitamente

Entre em contato