{"id":2285,"date":"2016-06-06T01:00:01","date_gmt":"2016-06-06T01:00:01","guid":{"rendered":"https:\/\/www.couchbase.com\/blog\/?p=2285"},"modified":"2024-09-12T01:16:35","modified_gmt":"2024-09-12T08:16:35","slug":"why-spark-and-nosql","status":"publish","type":"post","link":"https:\/\/www.couchbase.com\/blog\/pt\/why-spark-and-nosql\/","title":{"rendered":"Por que usar o Spark com bancos de dados NoSQL?"},"content":{"rendered":"<h2>Introdu\u00e7\u00e3o<\/h2>\n<p>Nas \u00faltimas duas semanas, o Spark tem estado em meu c\u00e9rebro. \u00c9 compreens\u00edvel, na verdade, j\u00e1 que estou preparando um webinar da O'Reilly \"<a href=\"https:\/\/www.oreilly.com\/pub\/e\/3724\">Como aproveitar o Spark e o NoSQL para aplicativos orientados por dados<\/a>\" com <a href=\"https:\/\/www.couchbase.com\/blog\/pt\/author\/michael-nitschinger\/\">Michael Nitschinger<\/a> e uma palestra diferente, \"Spark and Couchbase: Aumentando o banco de dados operacional com o Spark\" para <a href=\"https:\/\/spark-summit.org\/2016\/\">Spark Summit 2016<\/a> com <a href=\"https:\/\/www.couchbase.com\/blog\/pt\/author\/matt-ingenthron\/\">Matt Ingenthron<\/a>. Em outro lugar, voc\u00ea pode aprender sobre o <a href=\"https:\/\/developer.couchbase.com\/documentation\/server\/4.1\/connectors\/spark-1.2\/spark-intro.html\">Conector do Couchbase Spark<\/a>O que h\u00e1 em nossa nova vers\u00e3o e como us\u00e1-la. Neste blog, quero falar sobre por que a melhor combina\u00e7\u00e3o de banco de dados \u00e9 o Apache Spark e um <a href=\"https:\/\/www.couchbase.com\/blog\/pt\/resources\/why-nosql\/\">Banco de dados NoSQL<\/a> formam uma boa combina\u00e7\u00e3o.<\/p>\n<h2>Fa\u00edsca 101<\/h2>\n<p>Se voc\u00ea n\u00e3o estiver familiarizado com ele, <a href=\"https:\/\/spark.apache.org\/\">Fa\u00edsca<\/a> \u00e9 uma estrutura de processamento de Big Data que faz an\u00e1lises, aprendizado de m\u00e1quina, processamento de gr\u00e1ficos e muito mais sobre grandes volumes de dados. \u00c9 semelhante ao Map Reduce, Hive, Impala, Mahout e outras camadas de processamento de dados criadas sobre o HDFS no Hadoop. Assim como o Hadoop, seu foco \u00e9 a otimiza\u00e7\u00e3o, mas \u00e9 melhor em muitos aspectos: em geral, \u00e9 mais r\u00e1pido, muito mais f\u00e1cil de programar e tem bons conectores para quase tudo. Diferentemente do Hadoop, \u00e9 f\u00e1cil come\u00e7ar a escrever e executar o Spark a partir da linha de comando em seu laptop e, em seguida, implant\u00e1-lo em um cluster para executar em um conjunto de dados completo.<\/p>\n<p>O que eu disse at\u00e9 agora pode dar a impress\u00e3o de que o Spark \u00e9 um banco de dados, mas ele \u00e9 enfaticamente <em>n\u00e3o<\/em> um banco de dados. Na verdade, ele \u00e9 um mecanismo de processamento de dados. O Spark l\u00ea dados <em>em massa<\/em> que est\u00e1 armazenado em algum lugar como HDFS, Amazon S3 ou Couchbase Server, realiza algum processamento nesses dados e grava os resultados para que possam ser usados posteriormente.  \u00c9 um sistema baseado em trabalho, como o Hadoop, em vez de um sistema on-line, como o Couchbase ou o Oracle. Isso significa que o Spark sempre paga um custo de inicializa\u00e7\u00e3o que o exclui de cargas de trabalho r\u00e1pidas do tipo leitura\/grava\u00e7\u00e3o aleat\u00f3ria. Assim como o Hadoop, o Spark \u00e9 excelente quando se trata da taxa de transfer\u00eancia geral do sistema, mas isso ocorre \u00e0s custas da lat\u00eancia.<\/p>\n<p>Em resumo, o Couchbase Server e o Spark resolvem problemas diferentes, mas ambos s\u00e3o bons para resolver. Vamos falar sobre por que as pessoas os usam juntos.<\/p>\n<h2>Caso de uso #1 de NoSQL e Spark: Operacionaliza\u00e7\u00e3o da an\u00e1lise\/aprendizagem de m\u00e1quina<\/h2>\n<p>N\u00e3o h\u00e1 d\u00favida sobre isso: os dados s\u00e3o um \u00f3timo material. Os grandes aplicativos on-line que s\u00e3o executados no Couchbase tendem a ter uma grande quantidade deles. As pessoas criam mais dados todos os dias quando fazem compras on-line, reservam viagens ou enviam mensagens umas \u00e0s outras. Quando procuro um cat\u00e1logo de produtos e coloco uma nova lente de c\u00e2mera no carrinho, algumas informa\u00e7\u00f5es precisam ser armazenadas no Couchbase para que eu possa concluir minha compra e receber meus novos produtos pelo correio.<\/p>\n<p>Muito mais pode ser feito com os dados da minha viagem de compras que s\u00e3o invis\u00edveis para mim: eles s\u00e3o analisados para ver quais produtos s\u00e3o comumente comprados juntos, para que a pr\u00f3xima pessoa que colocar essa lente em seu carrinho de compras receba melhores recomenda\u00e7\u00f5es de produtos para que tenha maior probabilidade de comprar. Ele pode ser verificado quanto a sinais de fraude para ajudar a proteger a mim e ao varejista contra bandidos. Ela pode ser rastreada para descobrir se eu preciso de um cupom ou de algum outro incentivo para concluir uma compra sobre a qual estou indeciso. Todos esses s\u00e3o exemplos de aprendizado de m\u00e1quina e minera\u00e7\u00e3o de dados que as empresas podem fazer usando o Spark.<\/p>\n<p><img decoding=\"async\" src=\"\/wp-content\/original-assets\/2016\/june\/why-spark-and-nosql\/use-case-1---nosql-and-spark-for-analytics-machine-learning.png\" \/><\/p>\n<p>Nessa ampla fam\u00edlia de casos de uso, o Spark fornece modelos de aprendizado de m\u00e1quina, previs\u00f5es, os resultados de grandes trabalhos de an\u00e1lise e assim por diante, e o Couchbase os torna interativos e os dimensiona para um grande n\u00famero de usu\u00e1rios. Alguns outros exemplos disso, al\u00e9m das recomenda\u00e7\u00f5es de compras on-line, incluem classificadores de spam para aplicativos de comunica\u00e7\u00e3o em tempo real, an\u00e1lise preditiva que personaliza listas de reprodu\u00e7\u00e3o para usu\u00e1rios de um aplicativo de m\u00fasica on-line e modelos de detec\u00e7\u00e3o de fraude para aplicativos m\u00f3veis que precisam tomar decis\u00f5es instant\u00e2neas para aceitar ou rejeitar um pagamento. Eu tamb\u00e9m incluiria nessa categoria um amplo grupo de aplicativos que s\u00e3o, na verdade, armazenamento de dados de \"\u00faltima gera\u00e7\u00e3o\", em que grandes quantidades de dados precisam ser processadas de forma barata e, em seguida, fornecidas de forma interativa a muitos e muitos usu\u00e1rios. Por fim, os cen\u00e1rios da Internet das coisas tamb\u00e9m se enquadram aqui, com a diferen\u00e7a \u00f3bvia de que os dados representam as a\u00e7\u00f5es de m\u00e1quinas em vez de pessoas.<\/p>\n<p>Tecnicamente, o que todos esses casos de uso t\u00eam em comum \u00e9 a divis\u00e3o em um banco de dados operacional e um cluster de processamento anal\u00edtico, cada um otimizado para sua carga de trabalho. Essa divis\u00e3o \u00e9 como a divis\u00e3o entre sistemas OLTP e OLAP, atualizada para a era do Big Data.  J\u00e1 falamos sobre o Spark do lado anal\u00edtico, agora vamos falar sobre o Couchbase e o lado operacional.<\/p>\n<h2>Couchbase: Acesso r\u00e1pido a dados operacionais em escala<\/h2>\n<p>O Couchbase Server foi criado para executar aplicativos r\u00e1pidos, dimension\u00e1veis, f\u00e1ceis de gerenciar e \u00e1geis o suficiente para evoluir junto com os requisitos de neg\u00f3cios. Os tipos de aplicativos que tendem a usar o aprendizado de m\u00e1quina e a an\u00e1lise do Spark tamb\u00e9m tendem a precisar dos recursos oferecidos pelo Couchbase:<\/p>\n<ul>\n<li>Modelo de dados flex\u00edvel, esquemas din\u00e2micos<\/li>\n<li>Linguagem de consulta avan\u00e7ada (N1QL)<\/li>\n<li>SDKs nativos<\/li>\n<li>Lat\u00eancias de menos de um milissegundo para opera\u00e7\u00f5es de valor-chave em escala<\/li>\n<li>Dimensionamento el\u00e1stico<\/li>\n<li>Facilidade de administra\u00e7\u00e3o<\/li>\n<li>XDCR (Replica\u00e7\u00e3o entre data centers)<\/li>\n<li>Alta disponibilidade e distribui\u00e7\u00e3o geogr\u00e1fica<\/li>\n<\/ul>\n<p>Sua camada de processamento de dados operacionais precisa ser distribu\u00edda para fins de resili\u00eancia, alta disponibilidade e por motivos de desempenho, pois a proximidade da localiza\u00e7\u00e3o geogr\u00e1fica do usu\u00e1rio \u00e9 importante. O mecanismo de distribui\u00e7\u00e3o deve ser transparente para os desenvolvedores e deve ser simples de operar. Todas essas propriedades, que s\u00e3o verdadeiras independentemente de voc\u00ea estar ou n\u00e3o usando o Spark, foram <a href=\"https:\/\/www.couchbase.com\/blog\/pt\/nosql-resources\/what-is-no-sql\/\">abordado extensivamente em outro lugar<\/a>.<\/p>\n<p>O Couchbase Spark Connector oferece uma integra\u00e7\u00e3o de c\u00f3digo aberto entre as duas tecnologias e tem alguns benef\u00edcios pr\u00f3prios:<\/p>\n<ul>\n<li><strong>Centrado na mem\u00f3ria<\/strong>. Tanto o Spark quanto o Couchbase s\u00e3o centrados na mem\u00f3ria. Isso pode reduzir significativamente o tempo de processamento de dados da primeira viagem de ida e volta, ou tamb\u00e9m reduzir o tempo de insight\/tempo de a\u00e7\u00e3o de ponta a ponta. O tempo para o insight refere-se \u00e0 viagem de ida e volta entre \"fazer uma observa\u00e7\u00e3o\" (armazenar alguns dados sobre o que um usu\u00e1rio ou m\u00e1quina est\u00e1 fazendo) e analisar esses dados, geralmente no contexto da cria\u00e7\u00e3o ou atualiza\u00e7\u00e3o de um modelo de aprendizado de m\u00e1quina e, em seguida, devolv\u00ea-los ao usu\u00e1rio de uma forma que ele possa usar, como uma previs\u00e3o nova e aprimorada.<\/li>\n<li><strong>R\u00e1pido<\/strong>. Al\u00e9m do fato de que tanto o Spark quanto o Couchbase s\u00e3o centrados na mem\u00f3ria, o Couchbase Spark Connector inclui uma s\u00e9rie de aprimoramentos de desempenho, incluindo predicado push down, localidade de dados \/ reconhecimento de topologia, <a href=\"https:\/\/www.couchbase.com\/blog\/pt\/subdoc-explained\/\">API de subdocumento<\/a> e loteamento impl\u00edcito.<\/li>\n<li><strong>Funcionalidade<\/strong>. O Couchbase Spark Connector permite que voc\u00ea use toda a gama de m\u00e9todos de acesso a dados para trabalhar com dados no Spark e no Couchbase Server: RDDs, DataFrames, Datasets, DStreams, opera\u00e7\u00f5es KV, consultas N1QL, Map Reduce e Visualiza\u00e7\u00f5es espaciais, e at\u00e9 mesmo DCP s\u00e3o todos compat\u00edveis com Scala e Java.<\/li>\n<\/ul>\n<p><img decoding=\"async\" src=\"\/wp-content\/original-assets\/2016\/june\/why-spark-and-nosql\/use-case-1---machine-learning-cycle---time-to-insight.png\" \/><\/p>\n<h2>Caso de uso do NoSQL e do Spark #2: kit de ferramentas de integra\u00e7\u00e3o de dados<\/h2>\n<p>A ampla gama de funcionalidades suportadas pelo Couchbase Spark Connector nos leva ao outro grande caso de uso do Spark e do Couchbase: Integra\u00e7\u00e3o de dados.<\/p>\n<p>O interesse pelo Spark explodiu nos \u00faltimos anos, o que fez com que o Spark se conectasse a quase tudo, de bancos de dados a Elasticsearch, Kafka, HDFS, Amazon S3 e muito mais. Ele tamb\u00e9m pode ler dados em praticamente qualquer formato, como Parquet, Avro, CSV, Apache Arrow, etc. Toda essa conectividade faz do Spark um excelente kit de ferramentas para resolver desafios de integra\u00e7\u00e3o de dados.<\/p>\n<p><img decoding=\"async\" src=\"\/wp-content\/original-assets\/2016\/june\/why-spark-and-nosql\/use-case-2---data-integration.png\" \/><\/p>\n<p>Por exemplo, imagine que voc\u00ea \u00e9 um engenheiro de dados. Voc\u00ea precisa carregar informa\u00e7\u00f5es sobre os interesses dos seus usu\u00e1rios nos perfis deles para dar suporte a um novo recurso premium que est\u00e1 adicionando ao seu aplicativo m\u00f3vel. Digamos que seus perfis de usu\u00e1rio estejam no Couchbase Server, seus interesses de usu\u00e1rio venham do HDFS e sua lista de usu\u00e1rios premium seja baseada em informa\u00e7\u00f5es de pagamento em seu <a href=\"https:\/\/www.couchbase.com\/blog\/pt\/database-vs-data-warehouse\/\">Armaz\u00e9m de dados<\/a>.<\/p>\n<p>Isso parece uma tarefa relativamente simples, mas tediosa, em que voc\u00ea vai a cada sistema para extrair as informa\u00e7\u00f5es de que precisa e depois as importa para o sistema seguinte. O Spark oferece uma alternativa pr\u00e1tica. Depois de se familiarizar com o Spark, voc\u00ea poder\u00e1 executar essa tarefa usando algumas consultas simples na linha de comando. Usando os recursos nativos de cada um dos sistemas, voc\u00ea pode unir as tabelas no Spark e gravar os resultados no Couchbase em uma \u00fanica etapa. N\u00e3o h\u00e1 nada mais conveniente.  As mesmas etapas podem ser ampliadas para criar pipelines de dados que combinam dados de v\u00e1rias fontes e os alimentam em aplicativos ou outros consumidores.<\/p>\n<h2>Experimente<\/h2>\n<p>N\u00e3o importa se voc\u00ea est\u00e1 desenvolvendo um grande aplicativo com aprendizado de m\u00e1quina sofisticado como parte de uma grande equipe de engenharia ou se \u00e9 um desenvolvedor solit\u00e1rio, o Spark e o Couchbase t\u00eam algo a oferecer. <a href=\"https:\/\/developer.couchbase.com\/documentation\/server\/4.1\/connectors\/spark-1.2\/spark-intro.html\">Experimente<\/a> e nos diga o que voc\u00ea achou. Como sempre, gostamos de ouvir sua opini\u00e3o. Boa codifica\u00e7\u00e3o!<\/p>","protected":false},"excerpt":{"rendered":"<p>Intro For the last couple weeks, I&#8217;ve had Spark on the brain. It&#8217;s understandable, really, since I&#8217;ve been preparing an O&#8217;Reilly webinar &#8220;How to Leverage Spark and NoSQL for Data Driven Applications&#8221; \u00a0with Michael Nitschinger and a different talk, &#8220;Spark [&hellip;]<\/p>","protected":false},"author":65,"featured_media":13873,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[1821,1816],"tags":[],"ppma_author":[9036],"class_list":["post-2285","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-couchbase-architecture","category-couchbase-server"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v26.1 (Yoast SEO v26.1.1) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Apache Spark w\/ NoSQL Databases: Best Use | Couchbase Blog<\/title>\n<meta name=\"description\" content=\"In this Couchbase blog, we talk about why Apache Spark and a NoSQL database make a good combination. Get a crash course in Spark 101 for best practices.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.couchbase.com\/blog\/pt\/why-spark-and-nosql\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Why Use Spark With NoSQL Databases?\" \/>\n<meta property=\"og:description\" content=\"In this Couchbase blog, we talk about why Apache Spark and a NoSQL database make a good combination. Get a crash course in Spark 101 for best practices.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.couchbase.com\/blog\/pt\/why-spark-and-nosql\/\" \/>\n<meta property=\"og:site_name\" content=\"The Couchbase Blog\" \/>\n<meta property=\"article:published_time\" content=\"2016-06-06T01:00:01+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-09-12T08:16:35+00:00\" \/>\n<meta name=\"author\" content=\"Will Gardella, Director, Product Management, Couchbase\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Will Gardella, Director, Product Management, Couchbase\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/\"},\"author\":{\"name\":\"Will Gardella, Director, Product Management, Couchbase\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/#\/schema\/person\/16361083d282711e0137f93b708ce062\"},\"headline\":\"Why Use Spark With NoSQL Databases?\",\"datePublished\":\"2016-06-06T01:00:01+00:00\",\"dateModified\":\"2024-09-12T08:16:35+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/\"},\"wordCount\":1448,\"commentCount\":1,\"publisher\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/#organization\"},\"image\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png\",\"articleSection\":[\"Couchbase Architecture\",\"Couchbase Server\"],\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/\",\"url\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/\",\"name\":\"Apache Spark w\/ NoSQL Databases: Best Use | Couchbase Blog\",\"isPartOf\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png\",\"datePublished\":\"2016-06-06T01:00:01+00:00\",\"dateModified\":\"2024-09-12T08:16:35+00:00\",\"description\":\"In this Couchbase blog, we talk about why Apache Spark and a NoSQL database make a good combination. Get a crash course in Spark 101 for best practices.\",\"breadcrumb\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage\",\"url\":\"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png\",\"contentUrl\":\"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png\",\"width\":1800,\"height\":630},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/www.couchbase.com\/blog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Why Use Spark With NoSQL Databases?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/#website\",\"url\":\"https:\/\/www.couchbase.com\/blog\/\",\"name\":\"The Couchbase Blog\",\"description\":\"Couchbase, the NoSQL Database\",\"publisher\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.couchbase.com\/blog\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/#organization\",\"name\":\"The Couchbase Blog\",\"url\":\"https:\/\/www.couchbase.com\/blog\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/2023\/04\/admin-logo.png\",\"contentUrl\":\"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/2023\/04\/admin-logo.png\",\"width\":218,\"height\":34,\"caption\":\"The Couchbase Blog\"},\"image\":{\"@id\":\"https:\/\/www.couchbase.com\/blog\/#\/schema\/logo\/image\/\"}},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/#\/schema\/person\/16361083d282711e0137f93b708ce062\",\"name\":\"Will Gardella, Director, Product Management, Couchbase\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/www.couchbase.com\/blog\/#\/schema\/person\/image\/94034c6625aea3f838289a292d6904f9\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/02b02044056ac5f8f16d9f9bb9655835aec233a42c12d08f4e95e030c522d35a?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/02b02044056ac5f8f16d9f9bb9655835aec233a42c12d08f4e95e030c522d35a?s=96&d=mm&r=g\",\"caption\":\"Will Gardella, Director, Product Management, Couchbase\"},\"description\":\"Will Gardella is Director of Product Management for analytics at Couchbase. Previously, he was a product manager in the big data platform team at HP, a senior director of product management for SAP HANA, and the senior director of SAP Research's global Big Data program focused on big data and machine learning.\",\"url\":\"https:\/\/www.couchbase.com\/blog\/pt\/author\/will-gardella\/\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Apache Spark w\/ NoSQL Databases: Best Use | Couchbase Blog","description":"Neste blog do Couchbase, falamos sobre por que o Apache Spark e um banco de dados NoSQL s\u00e3o uma boa combina\u00e7\u00e3o. Fa\u00e7a um curso intensivo sobre o Spark 101 para conhecer as pr\u00e1ticas recomendadas.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.couchbase.com\/blog\/pt\/why-spark-and-nosql\/","og_locale":"pt_BR","og_type":"article","og_title":"Why Use Spark With NoSQL Databases?","og_description":"In this Couchbase blog, we talk about why Apache Spark and a NoSQL database make a good combination. Get a crash course in Spark 101 for best practices.","og_url":"https:\/\/www.couchbase.com\/blog\/pt\/why-spark-and-nosql\/","og_site_name":"The Couchbase Blog","article_published_time":"2016-06-06T01:00:01+00:00","article_modified_time":"2024-09-12T08:16:35+00:00","author":"Will Gardella, Director, Product Management, Couchbase","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Will Gardella, Director, Product Management, Couchbase","Est. reading time":"7 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#article","isPartOf":{"@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/"},"author":{"name":"Will Gardella, Director, Product Management, Couchbase","@id":"https:\/\/www.couchbase.com\/blog\/#\/schema\/person\/16361083d282711e0137f93b708ce062"},"headline":"Why Use Spark With NoSQL Databases?","datePublished":"2016-06-06T01:00:01+00:00","dateModified":"2024-09-12T08:16:35+00:00","mainEntityOfPage":{"@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/"},"wordCount":1448,"commentCount":1,"publisher":{"@id":"https:\/\/www.couchbase.com\/blog\/#organization"},"image":{"@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage"},"thumbnailUrl":"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png","articleSection":["Couchbase Architecture","Couchbase Server"],"inLanguage":"pt-BR","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/","url":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/","name":"Apache Spark w\/ NoSQL Databases: Best Use | Couchbase Blog","isPartOf":{"@id":"https:\/\/www.couchbase.com\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage"},"image":{"@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage"},"thumbnailUrl":"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png","datePublished":"2016-06-06T01:00:01+00:00","dateModified":"2024-09-12T08:16:35+00:00","description":"Neste blog do Couchbase, falamos sobre por que o Apache Spark e um banco de dados NoSQL s\u00e3o uma boa combina\u00e7\u00e3o. Fa\u00e7a um curso intensivo sobre o Spark 101 para conhecer as pr\u00e1ticas recomendadas.","breadcrumb":{"@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/"]}]},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#primaryimage","url":"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png","contentUrl":"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/sites\/1\/2022\/11\/couchbase-nosql-dbaas.png","width":1800,"height":630},{"@type":"BreadcrumbList","@id":"https:\/\/www.couchbase.com\/blog\/why-spark-and-nosql\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.couchbase.com\/blog\/"},{"@type":"ListItem","position":2,"name":"Why Use Spark With NoSQL Databases?"}]},{"@type":"WebSite","@id":"https:\/\/www.couchbase.com\/blog\/#website","url":"https:\/\/www.couchbase.com\/blog\/","name":"Blog do Couchbase","description":"Couchbase, o banco de dados NoSQL","publisher":{"@id":"https:\/\/www.couchbase.com\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.couchbase.com\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR"},{"@type":"Organization","@id":"https:\/\/www.couchbase.com\/blog\/#organization","name":"Blog do Couchbase","url":"https:\/\/www.couchbase.com\/blog\/","logo":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/www.couchbase.com\/blog\/#\/schema\/logo\/image\/","url":"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/2023\/04\/admin-logo.png","contentUrl":"https:\/\/www.couchbase.com\/blog\/wp-content\/uploads\/2023\/04\/admin-logo.png","width":218,"height":34,"caption":"The Couchbase Blog"},"image":{"@id":"https:\/\/www.couchbase.com\/blog\/#\/schema\/logo\/image\/"}},{"@type":"Person","@id":"https:\/\/www.couchbase.com\/blog\/#\/schema\/person\/16361083d282711e0137f93b708ce062","name":"Will Gardella, diretor de gerenciamento de produtos, Couchbase","image":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/www.couchbase.com\/blog\/#\/schema\/person\/image\/94034c6625aea3f838289a292d6904f9","url":"https:\/\/secure.gravatar.com\/avatar\/02b02044056ac5f8f16d9f9bb9655835aec233a42c12d08f4e95e030c522d35a?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/02b02044056ac5f8f16d9f9bb9655835aec233a42c12d08f4e95e030c522d35a?s=96&d=mm&r=g","caption":"Will Gardella, Director, Product Management, Couchbase"},"description":"Will Gardella \u00e9 diretor de gerenciamento de produtos para an\u00e1lise na Couchbase. Anteriormente, ele foi gerente de produto na equipe de plataforma de Big Data da HP, diretor s\u00eanior de gerenciamento de produtos para SAP HANA e diretor s\u00eanior do programa global de Big Data da SAP Research, com foco em Big Data e aprendizado de m\u00e1quina.","url":"https:\/\/www.couchbase.com\/blog\/pt\/author\/will-gardella\/"}]}},"authors":[{"term_id":9036,"user_id":65,"is_guest":0,"slug":"will-gardella","display_name":"Will Gardella, Director, Product Management, Couchbase","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/02b02044056ac5f8f16d9f9bb9655835aec233a42c12d08f4e95e030c522d35a?s=96&d=mm&r=g","author_category":"","last_name":"Gardella","first_name":"Will","job_title":"","user_url":"","description":"Will Gardella \u00e9 diretor de gerenciamento de produtos para an\u00e1lise na Couchbase. Anteriormente, ele foi gerente de produto na equipe de plataforma de Big Data da HP, diretor s\u00eanior de gerenciamento de produtos para SAP HANA e diretor s\u00eanior do programa global de Big Data da SAP Research, com foco em Big Data e aprendizado de m\u00e1quina."}],"_links":{"self":[{"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/posts\/2285","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/users\/65"}],"replies":[{"embeddable":true,"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/comments?post=2285"}],"version-history":[{"count":0,"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/posts\/2285\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/media\/13873"}],"wp:attachment":[{"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/media?parent=2285"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/categories?post=2285"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/tags?post=2285"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.couchbase.com\/blog\/pt\/wp-json\/wp\/v2\/ppma_author?post=2285"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}