FakeIt Series 1 of 5: Generating Fake Data

Aaron Benton es un arquitecto experimentado especializado en soluciones creativas para desarrollar aplicaciones móviles innovadoras. Tiene más de 10 años de experiencia en desarrollo full stack, incluyendo ColdFusion, SQL, NoSQL, JavaScript, HTML y CSS. Aaron es actualmente Arquitecto de Aplicaciones para Shop.com en Greensboro, Carolina del Norte y es un Campeón de la comunidad Couchbase.

FakeIt Serie 1 de 5: Generación de datos falsos

Hay innumerables entradas de blog sobre modelado de datosy patrones de documentos. Todos estos posts dan una gran introducción a cómo estructurar y modelar tus documentos en Couchbase, pero ninguno de ellos te dice qué hacer a continuación. En esta serie de blogs vamos a responder a la pregunta, ¿qué hacer después de haber definido tu modelo de datos?

Modelo de usuario

Para esta serie vamos a trabajar con una aplicación de comercio electrónico greenfield. Como con la mayoría de las aplicaciones de comercio electrónico, nuestra aplicación va a tener usuarios, así que aquí es donde vamos a empezar.

Para empezar, hemos definido un modelo de usuario básico.

{
 "_id": "user_0",
 "doc_type": "user",
 "user_id": 0,
 "first_name": "Mac",
 "last_name": "Carter",
 "username": "Salma.Ratke",
 "password": "DvA6YrMGtgsKKnG",
 "email_address": "Ludie74@hotmail.com",
 "created_on": 1457172796088
}

{

"_id": "usuario_0",

"doc_type": "usuario",

"user_id": 0,

"nombre": "Mac",

"apellido": "Carter",

"nombre de usuario": "Salma.Ratke",

"contraseña": "DvA6YrMGtgsKKnG",

"dirección_electrónica": "Ludie74@hotmail.com",

"creado_en": 1457172796088

}

Hemos hecho lo más difícil, que es definir nuestro modelo, pero ¿ahora qué?

¿Cómo representamos este modelo?
¿Cómo documentamos este modelo?
¿Se basa este modelo en datos de otros modelos?
¿Cómo se pueden generar datos a partir de este modelo?
¿Cómo podemos generar datos falsos o de prueba?

Por suerte para nosotros existe un proyecto NodeJS llamado FakeIt que pueda respondernos a todas estas preguntas. FakeIt es una utilidad de línea de comandos que genera datos falsos en formatos json, yaml, yml, cson o csv basados en modelos definidos en yaml. Los datos pueden generarse utilizando cualquier combinación de FakerJS, ChanceJS o funciones personalizadas. Los datos generados pueden ser emitidos en los siguientes formatos y destinos:

json
yaml
cson
csv
Archivo Zip de archivos json, yaml, cson o csv
Servidor Couchbase
Servidor Couchbase Sync Gateway

Podemos definir un modelo FakeIt en YAML para representar nuestro modelo JSON. Esto nos proporciona un modelo documentado y tipado por datos que podemos comunicar cómo debe ser la estructura de nuestro modelo y para qué sirven las propiedades.

name: Users
type: object
key: _id
properties:
  _id:
    type: string
    description: The document id built by the prefixed "user_" and the users id
  doc_type:
    type: string
    description: The document type
  user_id:
    type: integer
    description: The users id
  first_name:
    type: string
    description: The users first name
  last_name:
    type: string
    description: The users last name
  username:
    type: string
    description: The users username
  password:
    type: string
    description: The users password
  email_address:
    type: string
    description: The users email address
  created_on:
    type: integer
    description: An epoch time of when the user was created

nombre: Usuarios

tipo: objeto

clave: _id

propiedades:

_id:

tipo: cadena

descripción: En documento id construido por el prefijo "usuario_" y el usuarios id

tipo_doc:

tipo: cadena

descripción: En documento tipo

usuario_id:

tipo: entero

descripción: En usuarios id

nombre:

tipo: cadena

descripción: En usuarios primero nombre

apellido:

tipo: cadena

descripción: En usuarios último nombre

nombre de usuario:

tipo: cadena

descripción: En usuarios nombre de usuario

contraseña:

tipo: cadena

descripción: En usuarios contraseña

dirección_electrónica:

tipo: cadena

descripción: En usuarios correo electrónico dirección

creado_en:

tipo: entero

descripción: En época tiempo de cuando el usuario fue creado

Probablemente te estés diciendo, "Genial, he definido mi modelo en YAML pero ¿de qué me sirve?" Uno de los mayores problemas a los que se enfrentan los desarrolladores cuando empiezan a desarrollar es tener datos con los que trabajar. A menudo se pierde una cantidad exorbitante de tiempo creando documentos manualmente, escribiendo código para rellenar un cubo. Además, es posible que tenga un volcado de datos completo o parcial de su base de datos que tiene que ser importado.

Estos son lentos, tediosos y, en el caso de un volcado de datos, no proporcionan ninguna información o documentación sobre los modelos disponibles. Podemos añadir unas sencillas propiedades a nuestro modelo FakeIt que describan cómo debe generarse nuestro modelo, y a través de un único archivo podemos crear un sinfín de documentos aleatorios falsos.

name: Users
type: object
key: _id
properties:
  _id:
    type: string
    description: The document id built by the prefix "user_" and the users id
    data:
      post_build: `user_${this.user_id}`
  doc_type:
    type: string
    description: The document type
    data:
      value: user
  user_id:
    type: integer
    description: An auto-incrementing number
    data:
      build: document_index
  first_name:
    type: string
    description: The users first name
    data:
      build: faker.name.firstName()
  last_name:
    type: string
    description: The users last name
    data:
      build: faker.name.lastName()
  username:
    type: string
    description: The username
    data:
      build: faker.internet.userName()
  password:
    type: string
    description: The users password
    data:
      build: faker.internet.password()
  email_address:
    type: string
    description: The users email address
    data:
      build: faker.internet.email()
  created_on:
    type: integer
    description: An epoch time of when the user was created
    data:
      build: new Date(faker.date.past()).getTime()

nombre: Usuarios

tipo: objeto

clave: _id

propiedades:

_id:

tipo: cadena

descripción: En documento id construido por el prefijo "usuario_" y el usuarios id

datos:

post_build: `usuario_${este.usuario_id}`

tipo_doc:

tipo: cadena

descripción: En documento tipo

datos:

valor: usuario

usuario_id:

tipo: entero

descripción: En auto-incrementando número

datos:

construya: documento_índice

nombre:

tipo: cadena

descripción: En usuarios primero nombre

datos:

construya: farsante.nombre.firstName()

apellido:

tipo: cadena

descripción: En usuarios último nombre

datos:

construya: farsante.nombre.apellido()

nombre de usuario:

tipo: cadena

descripción: En nombre de usuario

datos:

construya: farsante.internet.nombredeusuario()

contraseña:

tipo: cadena

descripción: En usuarios contraseña

datos:

construya: farsante.internet.contraseña()

dirección_electrónica:

tipo: cadena

descripción: En usuarios correo electrónico dirección

datos:

construya: farsante.internet.correo electrónico()

creado_en:

tipo: entero

descripción: En época tiempo de cuando el usuario fue creado

datos:

construya: nuevo Fecha(farsante.fecha.pasado()).getTime()

Hemos añadido una propiedad de datos a cada una de las propiedades de nuestros modelos que describe cómo se debe generar ese valor. FakeIt soporta 5 formas diferentes de generar un valor:

pre_build: para inicializar el valor
construir: que construye un valor
falso: Una cadena de plantilla FakerJS, por ejemplo {{internet.userName}}
valor: Un valor estático a utilizar
post_build: una función que se ejecuta después de establecer todas las propiedades del modelo

Estas funciones de compilación son un cuerpo de función JavaScript. A cada una de estas funciones se le pasan las siguientes variables que se pueden utilizar en el momento de su ejecución:

documentos - Un objeto que contiene una clave para cada modelo cuyo valor es una matriz de cada documento que se ha generado
globals - Un objeto que contiene cualquier variable global que pueda haber sido establecida por cualquiera de las funciones run o build
inputs - Un objeto que contiene una clave para cada archivo de entrada utilizado cuyo valor es la versión deserializada de los datos de los archivos
faker - Una referencia a FakerJS
chance - Una referencia a ChanceJS
document_index - Es un número que representa la posición del documento generado actualmente en el orden de ejecución
require - Esta es la función require del nodo, le permite requerir sus propios paquetes. Para un mejor rendimiento requerir y seth ellos en la función pre_run.

Por ejemplo, si nos fijamos en la función de construcción de propiedades de nombre de usuario se vería así:

function (documents, globals, inputs, faker, chance, document_index, require) {
 return faker.internet.userName();
}

función (documentos, globales, entradas, farsante, oportunidad, índice_documento, requiere) {

devolver farsante.internet.nombredeusuario();

}

Ahora que hemos definido cómo debe generarse nuestro modelo, podemos empezar a generar algunos datos falsos con él.

Con nuestro modelo de usuarios guardado en un archivo models/users.yaml, podemos enviar los datos directamente a la consola utilizando el comando

fakeit console models/users.yaml

1	fakeit consola modelos/usuarios.yaml

Usando este mismo modelo podemos generar 100 archivos JSON y guardarlos en un directorio llamado output/ usando el comando

fakeit directory –count 100 –verbose output models/users.yaml

1	fakeit directorio -cuente 100 -verbose salida modelos/usuarios.yaml

Además, podemos crear un archivo zip de 1.000 archivos JSON utilizando el comando:

fakeit directory –count 1000 –verbose output/users.zip models/users.yaml

1	fakeit directorio -cuente 1000 -verbose salida/usuarios.zip modelos/usuarios.yaml

Incluso podemos generar un único archivo CSV de nuestro modelo utilizando el siguiente comando:

fakeit directory –count 25 –format csv –verbose output/ models/users.yaml

1	fakeit directorio -cuente 25 -formato csv -verbose salida/ modelos/usuarios.yaml

Esto creará un único archivo CSV cuyo nombre es el nombre del modelo, en este caso nombre: Usuarios con el archivo resultante llamado Usuarios.csv

Tanto si utilizas archivos JSON, archivos Zip o archivos CSV, todos ellos pueden importarse a Couchbase Server utilizando las herramientas CLI cbdocloader (para archivos *.json y *.zip) o cbimport (para archivos *.json y *.csv)

Mientras que la generación de archivos estáticos es beneficioso, todavía hay el paso extra de tener que importarlos a Couchbase Server a través de las herramientas CLI disponibles. FakeIt también soporta Couchbase Server y Sync Gateway como destinos de salida. Podemos generar 10.000 documentos JSON a partir de nuestro modelo users.yaml, y enviarlos a un bucket llamado ecommerce en un Couchbase Server ejecutándose localmente usando el comando:

fakeit couchbase –server 127.0.0.1 –bucket ecommerce –count 10000 –verbose models/users.yaml

1	fakeit couchbase -servidor 127.0.0.1 -cubo comercio electrónico -cuente 10000 -verbose modelos/usuarios.yaml

Conclusión

Hemos visto cómo podemos representar el modelo JSON de un usuario usando YAML para documentar y describir cómo debe generarse un valor de propiedades. Ese único archivo users.yaml puede ser enviado a la consola, archivos JSON, archivo Zip de archivos JSON, archivos CSV, e incluso directamente a Couchbase. FakeIt es una herramienta fantástica para acelerar tu desarrollo y generar grandes conjuntos de datos de desarrollo. Puede guardar sus modelos FakeIt como parte de su código base para facilitar la repetición de conjuntos de datos por cualquier desarrollador.

FakeIt es una herramienta para facilitar el desarrollo y las pruebas de tu despliegue de Couchbase. Aunque puede generar grandes cantidades de datos, no es una verdadera herramienta de pruebas de carga. Hay herramientas CLI disponibles para pruebas de carga y dimensionamiento tales como cbc-pillowfight y cbworkloadgen

A continuación

Este post forma parte del Programa de Escritura de la Comunidad Couchbase

Laura Czajkowski, Directora de la Comunidad de Desarrolladores, Couchbase

Comparte este artículo

4 Comentarios

FakeIt Series 2 de 5: Datos compartidos y dependencias - The Couchbase Blog marzo 23, 2017 a 12:00 pm

[...] FakeIt Serie 1 de 5: Generando Datos Falsos aprendimos que FakeIt puede generar una gran cantidad de datos aleatorios basados en un solo archivo YAML y [...]

Inicia sesión para responder
FakeIt Series 4 de 5: Trabajar con datos existentes - The Couchbase Blog abril 6, 2017 a 10:36 am

[...] hasta ahora en nuestra serie FakeIt hemos visto cómo podemos Generar Datos Falsos, Compartir Datos y Dependencias, y utilizar Definiciones para modelos más pequeños. Hoy vamos a ver [...]

Inicia sesión para responder
Líder del sector: Aaron Benton, de Market America, reconocido como campeón de la comunidad Couchbase - Being JR Ridinger abril 13, 2017 a 1:09 pm

[...] Serie FakeIt 1 de 5: Generación de datos falsos [...]

Inicia sesión para responder
Lior King abril 23, 2019 a 2:01 am

En Couchbase 5.0 y superiores, es necesario especificar un nombre de usuario y una contraseña para Couchbase.
Puede hacerlo añadiendo los parámetros -username (o -u) y -password (o -p) al comando "fakeit couchbase

Inicia sesión para responder

Deja un comentario Cancelar respuesta

Lo siento, debes estar conectado para publicar un comentario.

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

FakeIt Serie 1 de 5: Generación de datos falsos

FakeIt Serie 1 de 5: Generación de datos falsos

Modelo de usuario

Conclusión

A continuación

Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada

Autor

Publicado por Laura Czajkowski, Directora de la Comunidad de Desarrolladores, Couchbase

4 Comentarios

Deja un comentario Cancelar respuesta

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Utilizar Capella gratis

Póngase en contacto