Análisis de Couchbase

Big Data moderno > Hadoop

Así es. Un moderno solución big data requiere algo más que Hadoop. Bienvenido a los datos, todo es grande y rápido.

Bienvenido a Central de Big Data

Debatir sobre Noticias Hacker

Debatir sobre Reddit

Me complace anunciar que Big Data Central ya está en marcha.

Representa mi historia de big data para Couchbase. Trata sobre el papel de las bases de datos NoSQL en un mundo de big data.

Hubo un tiempo en que big data era Hadoop. Era analítica offline. Eso ya no es así. Es una solución. Es una solución que incluye Hadoop pero es no Hadoop. Es una solución que satisface tanto los requisitos analíticos en tiempo real y requisitos analíticos fuera de línea. Es una solución que cumple ambos requisitos analíticos y requisitos operativos.

El ecosistema de big data incluye ahora Storm para el procesamiento en tiempo real, Couchbase Server para el acceso a datos de alto rendimiento, Hadoop para el análisis offline, ¡y mucho más!

Existen tres retos para los macrodatos:

  1. La cantidad de datos que se generan, el volumen de datos.
  2. El ritmo al que se generan los datos, la velocidad de los datos.
  3. El ritmo al que debe generarse la información, la velocidad de la información.

Hadoop se ocupa del volumen de datos. Puede almacenar y procesar una gran cantidad de datos, más tarde. Se amplía para almacenar y procesar más datos. Hadoop no se ocupa de la velocidad de los datos. Sin embargo, cumple los requisitos analíticos offline.

Couchbase Server aborda la velocidad de los datos. Es una base de datos NoSQL de alto rendimiento que puede almacenar gran cantidad de datos, ahora. Se amplía para almacenar muchos datos, más rápido. Couchbase Server no se ocupa de la velocidad de la información. Puede almacenar y procesar datos en reposo. Sin embargo, cumple los requisitos operativos.

Storm aborda la velocidad de la información. Puede procesar un flujo de datos en tiempo real. Se amplía para procesar flujos de datos más rápidamente. Storm no se ocupa del volumen ni de la velocidad de los datos. No almacena datos. Procesa datos en movimiento. Sin embargo, cumple los requisitos analíticos en tiempo real.

Los tres retos de big data pueden superarse integrando Storm, Couchbase Server y Hadoop. Integrando Couchbase Server con storm, se puede procesar un flujo de datos en tiempo real y almacenados. Al integrar Couchbase Server con Hadoop, se pueden procesar muchos datos sin conexión.

Comparte este artículo
Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada
Este campo es obligatorio.

Autor

Publicado por Shane Johnson, Director de Marketing de Producto, Couchbase

Shane K Johnson fue Director de Marketing de Producto en Couchbase. Antes de Couchbase, ocupó varios puestos en desarrollo y evangelización con formación en Java y sistemas distribuidos. Ha sido consultor de organizaciones de los sectores financiero, minorista, de las telecomunicaciones y de los medios de comunicación para diseñar e implantar arquitecturas basadas en sistemas distribuidos para datos y análisis.

5 Comentarios

  1. Shane, muy buen artículo sobre Big Data. Con la explosión del big data, las empresas se enfrentan a retos relacionados con los datos en tres ámbitos diferentes. En primer lugar, usted sabe el tipo de resultados que desea de sus datos, pero es computacionalmente difícil de obtener. En segundo lugar, se conocen las preguntas que hay que hacer, pero las respuestas son difíciles de encontrar y hay que recurrir a la minería de datos para hallarlas. Y, en tercer lugar, en el área de exploración de datos, donde es necesario desvelar las incógnitas y buscar en los datos patrones y relaciones ocultas. La plataforma de procesamiento de big data de código abierto HPCC Systems puede ayudar a las empresas a superar estos retos, ya que permite obtener información de conjuntos de datos masivos de forma rápida y sencilla. Diseñada por científicos de datos, es una solución integrada completa, desde la ingesta y el procesamiento de datos hasta su entrega. Su biblioteca de aprendizaje automático incorporada y los algoritmos de procesamiento Matrix pueden ayudar con la inteligencia empresarial y el análisis predictivo. Más información en http://hpccsystems.com

  2. Sí, para entender Hadoop moderno, todo el mundo necesita aprender Apache Storm, Spark, MapReduce, hbase, etc.

    Apache Storm es un motor de código abierto que puede procesar datos en tiempo real utilizando su arquitectura distribuida. Storm es sencillo y flexible. Se puede utilizar con cualquier lenguaje de programación de su elección.

    Veamos los distintos componentes de un Storm Cluster:

    1 - Nodo Nimbus. El nodo maestro (similar a JobTracker)

    2 - Nodos supervisores. Inicia/detiene trabajadores y se comunica con Nimbus a través de Zookeeper.

    3 - Nodos ZooKeeper. Coordina el clúster Storm

    Tanto Spark como Storm pueden funcionar en un clúster Hadoop y acceder al almacenamiento Hadoop. Storm-YARN es la implementación de código abierto de Yahoo de la convergencia de Storm y Hadoop. Spark proporciona integración nativa para Hadoop. La integración con Hadoop se consigue a través de YARN (NextGen MapReduce). La integración de análisis en tiempo real con sistemas basados en Hadoop permite una mejor utilización de los recursos de clúster gracias a la elasticidad computacional y, al estar en el mismo clúster, las transferencias de red pueden ser mínimas.

    No puedo compartir la información completa relacionada con hadoop, spark y storm así que por favor visite los siguientes enlaces para tutoriales informativos.

    Por temas para aprender o entender:- http://intellipaat.com/hadoop-

    Para tutoriales de YouTube :- https://www.youtube.com/user/i

  3. Gracias por compartir una información tan maravillosa....
    Aprender Hadoop a través de Internet para más detalles Por favor, vaya a través del enlace
    http://www.leadonlinetraining….

  4. Consultoría MindsMapped octubre 16, 2015 a 9:24 pm

    Buen artículo. Me encanta leer tres retos. http://www.mindsmapped.com/big

Deja un comentario

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Consulte nuestro portal para desarrolladores para explorar NoSQL, buscar recursos y empezar con tutoriales.

Utilizar Capella gratis

Ponte manos a la obra con Couchbase en unos pocos clics. Capella DBaaS es la forma más fácil y rápida de empezar.

Póngase en contacto

¿Quieres saber más sobre las ofertas de Couchbase? Permítanos ayudarle.