Hoy es un día emocionante para Membase. Varios de nosotros estamos asistiendo a Hadoop World 2010 en la ciudad de Nueva York, y si la recepción del evento de esta noche es una indicación de lo que vendrá mañana, va a ser un evento que no me hubiera querido perder. Una multitud muy inteligente de científicos de datos en la vanguardia de la aplicación de Hadoop, y Membase, para resolver algunos muy interesantes, y diversos, problemas de aplicación y gestión de datos.
Hemos estado trabajando muy estrechamente con Cloudera durante el último año en una serie de entornos de clientes en los que Membase y Cloudera han sido evaluados y desplegados conjuntamente. Por el camino, Mike Olson, CEO de Cloudera, y anteriormente CEO de Sleepycat Software (que distribuía Berkeley DB y fue adquirida por Oracle en 2006), se unió a nuestro consejo asesor, en cuyo contexto ha sido un colaborador inestimable y un amigo.
Hoy hemos anunciado la culminación de todo nuestro trabajo conjunto. Naturalmente, hemos elegido anunciarlo juntos en Hadoop World. Nuestro anuncio tiene tres componentes: integración tecnológica, relación de salida al mercado y casos de éxito de clientes conjuntos.
En el frente de la integración tecnológica, hemos construido y estamos poniendo a disposición de los clientes dos mecanismos para integrar Membase y Cloudera Distribution for Hadoop (CDH). El primero es un módulo Membase NodeCode que puede transmitir datos de Membase a CDH en tiempo real. A medida que nuevos datos operativos entran en Membase, pueden ser masajeados en tiempo real y bombeados a un clúster CDH para su procesamiento. El segundo es una utilidad de carga por lotes derivada de Sqoop que permite cargar datos de Membase a CDH, y viceversa.
En el frente empresarial, hemos estado trabajando muy estrechamente con Cloudera en entornos de clientes en los que Membase y Hadoop han sido útiles conjuntamente. De este trabajo conjunto han surgido una serie de casos de uso específicos y hemos formalizado un programa para envolver esas soluciones conjuntas en ofertas que comercializaremos y venderemos conjuntamente. Los casos de uso incluyen segmentación de anuncios, ofertas y contenidos; captura y análisis de registros y flujos de eventos; y juegos sociales. En cada uno de estos casos, Membase y Hadoop se combinan para resolver un problema que sería imposible resolver con una de las dos soluciones por separado.
Pero para mí, lo más interesante de todo esto son los dos clientes conjuntos que hemos anunciado y que están utilizando con éxito Membase junto con CDH: Aol y ShareThis. Han creado dos de los sistemas de segmentación publicitaria más avanzados del mundo, que combinan lo mejor de CDH para convertir grandes cantidades de información de eventos vinculada a los usuarios (cookies) en perfiles de usuario. Estos perfiles se introducen en Membase, donde se pueden servir con una latencia inferior al milisegundo. Esta combinación de análisis de gran potencia con un rendimiento bruto en tiempo real es una poderosa combinación que ha tenido un enorme impacto para estos usuarios.
Hay muchos más usuarios en proyecto que ven enormes ventajas en una implantación conjunta de Membase-CDH.
Si por casualidad estás en Hadoop World, pásate por la sesión de la 1:45 de esta tarde para escuchar tanto a Aol como a ShareThis hablar sobre su experiencia combinando Membase con Cloudera Distribution for Hadoop.