Quando se trata de big data, o MongoDB está quase lá. É um começo, e isso é bom.
Discutir sobre Notícias Hacker
Discutir sobre Reddit
Histórico
Entrei na Couchbase em dezembro de 2013. No entanto, sou apaixonado pela tecnologia de Big Data há anos. Comecei a escrever sobre NoSQL em setembro de 2009 (link), e escrevi sobre big data enquanto era um Chapeleiro Vermelho (link).
Pensei que o MongoDB tivesse se posicionado como um solução de big data. Assisti a uma apresentação da Gartner sobre big data e NoSQL. Havia um banco de dados NoSQL listado no slide do ecossistema de Big Data. Era o MongoDB. Há um banco de dados NoSQL listado na página de Big Data da Wikipedia. É o MongoDB. Sinceramente, estou surpreso que Matt tenha sido "criticado" por pessoas que achavam que o MongoDB e o Hadoop eram concorrentes (link).
O Couchbase Server não está posicionado como uma solução de Big Data. No entanto, há um conector Hadoop certificado pela Cloudera para ele (link). Temos clientes que utilizam o Couchbase Server com o Hadoop. Adotamos uma abordagem cuidadosa em relação ao big data.
- O Hadoop é a base das soluções de Big Data.
- O Couchbase Server é um banco de dados NoSQL.
- O Couchbase Server não é uma alternativa ao Hadoop.
- Há um lugar para o NoSQL no Big Data.
MongoDB + Cloudera
Em 29 de abril de 2014, não acho que o MongoDB esteja se posicionando como uma solução de big data. Na verdade, eles estão planejando uma integração adequada com o Hadoop. Isso é ótimo para a comunidade NoSQL/grande volume de dados. Entretanto, ele representa uma solução de Big Data de primeira geração. Ela se baseia na importação e exportação de dados por meio de processos em lote. Em uma solução de Big Data de primeira geração, os requisitos de desempenho operacional e escalabilidade não são uma preocupação. Tampouco os requisitos de análise em tempo real.
Matt citou um caso de uso em que o Hadoop analisa a multidão e um banco de dados NoSQL interage com os indivíduos. As interações individuais são enviadas ao Hadoop, e a análise da multidão é enviada de volta ao banco de dados NoSQL. Para o Couchbase, esse não é apenas um caso de uso. É uma referência para o cliente. A AOL utiliza o Hadoop e o Couchbase Server para permitir a publicidade direcionada (link).
Central de Big Data
Central de Big Data foi ao ar em 14 de abril de 2014.
Acreditamos que a função do NoSQL é permitir que a empresa atenda aos requisitos operacionais e analíticos, tanto off-line quanto em tempo real. É para possibilitar soluções de big data de segunda geração. O ecossistema Hadoop atende aos requisitos analíticos. O NoSQL atende aos requisitos operacionais. Uma solução de big data de segunda geração depende da integração com Elasticsearch, Storm e outros. Ela permite a análise e a pesquisa em tempo real e, ao mesmo tempo, atende aos requisitos operacionais. Ela exige um banco de dados NoSQL escalável e de alto desempenho.
A LivePerson integrou o Hadoop, o Storm e o Couchbase Server para criar uma solução de big data de segunda geração. A arquitetura inclui processamento orientado por lote e processamento em tempo real. A LivePerson avaliou os bancos de dados NoSQL do Couchbase, MongoDB e DataStax. No entanto, somente o Couchbase Server foi capaz de atender aos requisitos de alta taxa de transferência.
Um banco de dados NoSQL que é limitado a um único bloqueio por banco de dados e por nó (link) e/ou difícil de escalonar não conseguirá viabilizar uma solução de Big Data de segunda geração. Essa é a diferença entre o MongoDB e o Couchbase Server. O MongoDB é adequado para soluções de Big Data de primeira geração. O Couchbase Server é ideal para soluções de big data de primeira e segunda geração.
Mais informações
O Big Data Central é um local para a comunidade de big data explorar casos de uso, tecnologias e arquiteturas. Descubra como os clientes do Couchbase, como LivePerson, AOL e PayPal, estão aproveitando o NoSQL e o Hadoop em soluções de Big Data, de primeira e segunda geração.