Consulta SQL++ / N1QL

De JSON a Insights: Nobel Prize Winners dataset.

Los premios Nobel se anuncian durante una semana en octubre y la ceremonia de entrega es hoy, 10 de diciembre ("en Australia ya es mañana"). Hay una interesante historia de cómo C. V. Raman (de Efecto Raman) reservado su billete a Estocolmo para la ceremonia de entrega de premios del 10 de diciembre incluso antes del anuncio, porque confiaba en ganar el premio.

Obtuve este conjunto de datos del repositorio "Awesome JSON Datasets" en https://github.com/jdorfman/awesome-json-datasets

El conjunto de datos del Premio Nobel tiene tres archivos de datos:

  • Laureados - contiene el perfil de cada galardonado.

  • País - Lista de países y código de país

 

  • Premio - la lista de cada premio por año y el ganador agrupado.

El documento del premio tiene un ID que enlaza con el documento individual del ganador en el documento del galardonado. Veamos los premios Nobel. En primer lugar, observe que la información sobre los premios es PLURAL y se almacena en una matriz. Una persona o una organización puede ganar más de un premio. Veamos quiénes han ganado más de un premio.

Tarea 1. ¿Cuántos han ganado más de un premio Nobel?

Consulta 1: Simplemente UNNEST la matriz de laureados para obtener el objeto individual de los ganadores del premio y luego simplemente determinar y filtrar por la longitud de la matriz. Hay una entrada por premio. Para más información sobre el manejo de matrices y las operaciones UNNEST, consulte el artículo: Trabajando con Arrays JSON en N1QL.

Tarea 2: Determinar qué país ha producido el mayor número de premios Nobel.

Consulta 2: simplemente anule los laureados y agrúpelos por el campo bornCountry.

Ahora, hay 33 ganadores sin país ni origen... ¿Qué está pasando aquí?

Parece que se trata de organizaciones internacionales y luego un par de ganadores cuyos datos faltan bornCountry.

Tarea 3: Cuántos han venido de la India.

Pregunta 3: Los premios Nobel se conceden desde 1901, pero India obtuvo su independencia en 1947. Hasta 1947, el país de nacimiento tiene como etiqueta "British India". Hagamos una búsqueda ampliada.

Resultados sorprendentes Además de los conocidos Premios Nobel indios, un par de famosos ganadores británicos, entre ellos Rudyard Kipling, nacieron en la India. Sólo hay un ganador que no nació en la India pero murió allí: La Madre Teresa.

Descubramos las categorías.

Tarea 4: Crear un gráfico apilado de los 7 países que más premios Nobel han ganado con categofy

Resultados (subconjunto para abreviar)

 

 

 

 

A partir de aquí, vamos a crear un gráfico de columnas apiladas de los 7 primeros países y mostrar los premios por categoría.

 

 

 

 

 

 

 

Todas estas manipulaciones de datos son para divertirse y aprender. Pero, el progreso y la paz que estos ganadores han logrado sin fronteras.

Puede descargar el conjunto de datos y Couchbase. A continuación, formula tus propias preguntas interesantes y respóndelas.

Comparte este artículo
Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada
Este campo es obligatorio.

Autor

Publicado por Keshav Murthy

Keshav Murthy es Vicepresidente de Couchbase R&D. Anteriormente, estuvo en MapR, IBM, Informix, Sybase, con más de 20 años de experiencia en diseño y desarrollo de bases de datos. Dirigió el equipo de I+D de SQL y NoSQL en IBM Informix. Ha recibido dos premios President's Club en Couchbase y dos premios Outstanding Technical Achievement en IBM. Keshav es licenciado en Informática e Ingeniería por la Universidad de Mysore (India), es titular de diez patentes estadounidenses y tiene tres pendientes.

Deja un comentario

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Consulte nuestro portal para desarrolladores para explorar NoSQL, buscar recursos y empezar con tutoriales.

Utilizar Capella gratis

Ponte manos a la obra con Couchbase en unos pocos clics. Capella DBaaS es la forma más fácil y rápida de empezar.

Póngase en contacto

¿Quieres saber más sobre las ofertas de Couchbase? Permítanos ayudarle.