Se uma imagem for Se uma visualização de dados vale mais do que mil palavras, ela vale mais do que mil pontos de dados.
Com o lançamento do Couchbase 7.0.2, o Query Workbench (e o Analytics Workbench) agora inclui uma guia Gráficos que permite criar gráficos e outras visualizações de dados com base nos resultados de uma determinada consulta.
Um olhar mais atento aos gráficos
Internamente, usamos o D3.js para renderizar os próprios gráficos. Cada valor individual pode ser visto usando a dica de ferramenta ao passar o mouse, e a legenda (cores e o que elas representam) dos gráficos multicoloridos é vista no canto direito da tela.
Os gráficos de visualização de dados também podem ser baixados como SVG usando o botão no lado direito da tela. O dimensionamento da tela ou da própria tela ajusta automaticamente os gráficos para caberem.
Aqui está um GIF de como é simples começar a usar gráficos enquanto se usa o query workbench:
A guia Charts (Gráficos) suporta oito tipos diferentes de gráficos:
- Dispersão Reunir
- Dispersão conectada
- Linha
- Área
- Bar
- Barra agrupada
- Torta
- Donut
Gráfico de dispersão
Os gráficos de dispersão incluem gráficos X-Y padrão com a capacidade de visualizar os dados por cor. Esse gráfico permite que você observe a relação entre dois valores e agrupe os pontos de dados usando um terceiro valor, basicamente como uma correlação. Os gráficos de dispersão são pontos que representam partes individuais de dados.
Digamos que tenhamos alguns dados de precipitação para uma determinada área no norte da Califórnia. Nosso conjunto de dados inclui a precipitação, o dia do ano hidrológico, a data em geral e a precipitação registrada para aquele dia.
No gráfico abaixo, mostramos a precipitação pluviométrica por ano nos últimos cinco anos.
|
1 |
selecionar DiaDoAnoDaÁgua,PrecipToDate,Ano de dados_de_chuva onde Ano em [2010,2012,2014,2016,2018,2021]; |
Vamos primeiro dar uma olhada em uma representação simples e tabular desses dados.
Ao plotar isso em um gráfico, obtemos o seguinte:
Outro exemplo divertido que podemos analisar é a plotagem dos dados geográficos de nosso amostra de viagem balde e plotagem de todos os aeroportos dos Estados Unidos.
|
1 |
selecionar * de `viagens-amostra` onde tipo = "aeroporto e país = "Estados Unidos"; |
Podemos ver os dados agrupados por fusos horários de forma tão organizada que nos dá um mapa dos EUA. Também podemos ver facilmente quaisquer discrepâncias nos dados ao visualizá-los usando gráficos. Aqui, vemos um ponto de dados aleatório para o fuso horário N que introduzi como um ponto de dados errôneo.
Esses tipos de gráficos são úteis quando você está tentando identificar a extensão da correlação entre dois valores. Usando o recurso de agrupamento, você pode agrupar pontos de dados com base na cor. Isso pode lhe mostrar se há lacunas inesperadas nos dados ou se há pontos discrepantes. Isso pode ser útil se você quiser segmentar os dados em diferentes partes, como no desenvolvimento de personas de usuários.
Quando temos muitos pontos de dados para plotar, pode ocorrer o problema de plotagem excessiva.
Gráfico de dispersão conectado
Semelhante ao gráfico de linhas, o gráfico de dispersão conectado exibe a evolução ou a tendência de um determinado valor numérico em relação a outro valor, geralmente representando um intervalo de tempo, enquanto também exibe os pontos de dados individuais. Ele permite que você visualize o tipo ou a relação ou a tendência, seja ela linear ou exponencial, etc.
Como exemplo, vamos analisar o mercado de criptomoedas, ou seja, Bitcoins, e ver como está a tendência dos valores altos para o mês de setembro usando a API Polygon IO.
|
1 |
selecionar millis_to_str(item.t,"2021-07-21") como data, item de enrolar("https://api.polygon.io/v2/aggs/ticker/X:BTCUSD/range/1/day/2021-09-01/2021-09-30?adjusted=true&sort=asc&apiKey=") como res não registrado res.resultados como item; |
Neste exemplo, usamos não registrado para nivelar os resultados aninhados retornados da API.
Gráfico de linhas
O gráfico de linhas é uma visualização de dados que exibe a evolução de um valor numérico em relação a outro valor, geralmente o tempo.
Vamos ver como as ações da Couchbase estão se saindo desde sua IPO em julho.
|
1 2 |
selecionar millis_to_str(item.t,"2021-07-21T21:00:00") como data, item de enrolar("https://api.polygon.io/v2/aggs/ticker/BASE/range/1/day/2021-07-22/2021-09-21?apiKey=") res não registrado res.resultados como item |
Os gráficos de linhas são usados para rastrear alterações em períodos curtos e longos. Quando há mudanças menores, os gráficos de linhas são melhores do que os gráficos de barras. Os gráficos de linhas também podem ser usados para comparar as mudanças no mesmo período de tempo para mais de um grupo.
Gráfico de área
Os gráficos de área são muito semelhantes aos gráficos de linhas e de barras, pois combinam um gráfico de linhas e de barras para mostrar como os valores numéricos mudam ao longo do tempo (ou o valor usado). Os gráficos de área oferecem uma distribuição na visualização de dados.
Para este exemplo, vamos trabalhar com alguns dados da COVID-19 para a Califórnia. Vamos dar uma olhada em algumas estatísticas de vacinação para o ano de 2021.
|
1 |
selecionar * de dados covid.estado.dados demográficos onde date_part_str(data,"ano") = 2021 limite 50; |
Gráficos de barras e gráficos de barras agrupados
Os gráficos de barras são usados para visualizar dados categóricos com barras retangulares com alturas proporcionais aos valores que representam.
Quando você quiser comparar vários valores em relação à mesma base (geralmente a do tempo), use um gráfico de barras agrupadas. Os gráficos de barras são especialmente úteis quando as alterações ao longo do tempo são maiores.
Primeiro, vamos plotar os mesmos dados do gráfico de área acima em um gráfico de barras.
Agora vamos comparar quais tipos de vacina foram mais populares por município no mês de setembro: Moderna, Pfizer ou Jansen?
|
1 |
selecionar moderna_doses,jj_doses, pfizer_doses,date_format_str(data,"2020-09-09") como data de dados covid.condado.vacinas onde date_part_str(data,"ano") = 2021 e date_part_str(data,"mês") em [9] |
Um ponto importante a ser observado nos gráficos de barras e de barras agrupadas é que, se a diferença entre o menor e o maior valor que está sendo plotado for alta, os valores menores serão plotados como 0 (sem uma barra).
Eventualmente, esse recurso adicionará suporte a uma escala logarítmica para plotar valores que variam muito.
Gráficos de rosca e gráficos de pizza
Os gráficos de rosca e de pizza representam uma parte de um todo. Eles dividem o total de dados em partes com base nos valores numéricos que você passa.
A diferença entre os gráficos de rosca e de pizza é principalmente cosmética. Se você preferir ver as partes como uma torta, escolha os gráficos de pizza. Nesses gráficos, os 3% dados mais baixos serão agrupados em outros e exibidos como uma lista na lateral da tela.
A partir dos nossos dados de vacinação contra a COVID-19, vamos dar uma olhada nos dados demográficos da distribuição da população.
|
1 |
selecionar população_total, race_label de dados covid.estado.dados demográficos; |
Para ver o gráfico de rosca, vamos ver o número de dados demográficos totalmente vacinados.
|
1 |
selecionar soma(fully_vaccinated) como vacinado, race_label de dados covid.estado.dados demográficos grupo por race_label; |
A visualização imediata de dados de gráficos nas guias do workbench de consulta facilita a obtenção imediata de insights sobre os dados.
Resumo dos recursos
Os novos recursos de gráficos incluem tudo o que se segue:
- O eixo X recebe um valor numérico ou
data,tempooucarimbo de data/horavalor. - Os formatos suportados de data, hora e carimbo de data/hora incluem ISO8601.
2021-09-21T05:04:55.9992021-09-21T05:04:552021-09-21 05:04:55.9992021-09-21 05:04:552021-09-21
- O eixo Y deve ser numérico.
- A opção gather-by-color assume qualquer valor que é usado para agrupar os dados.
- Para gráficos de pizza/donut, barra/barra agrupada, os valores devem ser sempre numéricos. Os rótulos podem ser numéricos, datas, horas, registros de data e hora (em um formato específico) e ordinais.
- Os dados geográficos (GIS) podem ser plotados usando gráficos X-Y (como visto no exemplo da amostra de viagem).
- Capacidade de passar o mouse.
- Baixe e compartilhe gráficos como SVG.
Trabalho futuro
Outros tipos de gráficos que planejamos suportar incluem:
- Gráficos multilinhas
- Vários gráficos na mesma tela
- Mapas
- Gráficos de barras empilhadas e percentuais
- Gráficos de barras bidirecionais
- Histogramas
- Gráficos de bolhas
- Mapas de densidade
- Gráficos de espaguete
- Mapas de calor
Também planejamos oferecer suporte a ordinais no eixo do gráfico e a mais formatos de data, hora e registro de data e hora.











