Así es. El Internet de las cosas no es big data. Son datos continuos. Si los big data son un océano, los datos continuos son un afluente. Y...
Un afluente no desemboca directamente en un mar u océano. Wikipedia
Los datos tampoco fluyen directamente hacia una plataforma de big data. Una plataforma de big data es volumen. No es velocidad ni variedad. Fluyen directamente a un procesador de flujo y/o a una base de datos, relacional o NoSQL, antes de pasar a una plataforma de big data.
Presenta dos retos para la base de datos:
- La velocidad del flujo de datos.
- El número de flujos de datos.
Velocidad del flujo de datos
Un aerogenerador no lee ni escribe en una plataforma de big data. Una plataforma de big data está diseñada para datos discretos y no estructurados. Un aerogenerador genera datos continuos y semiestructurados. Genera miles de puntos de datos por segundo. Sin embargo, podría añadir los datos de los sensores a un archivo local e importar el archivo a una plataforma de big data. Sin embargo, ya no son datos en tiempo real. No permite la agilidad operativa.
El número de flujos de datos
Hay 14.000 millones de cosas conectados a Internet. Hay 50.000 millones de sensores alimentando cosas datos. Son muchos flujos de datos.
¿Qué tiene esto que ver con Couchbase?
Es el frigorífico inteligente. Quiero uno. Cuando me beba la última leche, quiero que mi frigorífico lo sepa. Quiero que me haga una lista de la compra. Estoy dispuesto a escanear la tarjeta de barras de un galón de leche vacío antes de tirarlo a la basura con un escáner en la puerta del frigorífico. Cuando voy al supermercado, quiero visualizar mi lista de la compra en un teléfono móvil. Quizá sea mi teléfono móvil. Quizá sea el móvil de mi mujer.
Datos semiestructurados
Los datos deben ser semiestructurados. ¿Por qué? Es una lista. Es simple. Podría almacenarse en filas y columnas. Sin embargo, ¿qué pasa si la aplicación se actualiza para realizar un seguimiento del inventario? Quiero que mi frigorífico sepa cuántas botellas de agua me quedan. ¿Debería el desarrollador enviar una solicitud de cambio al administrador de la base de datos para modificar el esquema? No. ¿Y si la aplicación se actualiza para mostrarme el precio del agua embotellada en diferentes tiendas de comestibles para que pueda añadirla a una lista de la compra concreta? ¿Deberían los desarrolladores enviar una segunda solicitud de cambio al administrador de la base de datos para modificar de nuevo el esquema? No. Por eso las empresas inteligentes confían en Couchbase Server. El modelo de datos flexible aumenta la productividad de los desarrolladores, reduce los costes de desarrollo y el tiempo de comercialización. Aumenta la agilidad del mercado.
Escalabilidad
Supongo que todo el mundo quiere un frigorífico inteligente. Yo seré el primer cliente, pero ¿qué pasará cuando haya mil clientes, y luego decenas de miles de clientes, y finalmente millones de clientes? Va a ser lo mejor desde el pan rebanado. Sin embargo, ¿cómo escalarán los administradores de bases de datos una base de datos relacional para soportar millones de clientes y miles de millones de puntos de datos? ¿Tan difícil será? Demasiado difícil. ¿Cuánto tiempo y esfuerzo requerirá? Demasiado. Por eso la empresa inteligente confía en Couchbase Server. La arquitectura distribuida, no compartida, aumenta la eficiencia operativa y reduce los costes operativos. Aumenta la agilidad operativa.
Cuando digo que todo el mundo quiere un frigorífico inteligente, me refiero a todo el mundo. Me refiero a los consumidores de Norteamérica, LATAM, EMEA, APAC y más. Una cosa es escalar una base de datos dentro de un centro de datos. Otra cosa es escalar una base de datos a varios centros de datos.
¿Por qué ampliar más allá del centro de datos?
Localidad de los datos
- Un frigorífico inteligente de California debe leer y escribir en una base de datos de Estados Unidos.
- Un frigorífico inteligente de Dublín debe leer y escribir en una base de datos de Irlanda.
- Un frigorífico inteligente de Tokio debe leer y escribir en una base de datos de Japón.
Alta disponibilidad
- Si falla un nodo, la base de datos debe seguir disponible.
- Si falla un bastidor, la base de datos debe seguir disponible.
- Si falla un centro de datos, la base de datos debe seguir disponible.
Resumen
Couchbase Server soporta localización global de datos con replicación entre centros de datos (XDCR). Soporta disponibilidad global con conciencia de rack.
Aumenta el alcance global.