Pesquisa de vetores

Liberando o poder do AWS Bedrock com o Couchbase

A explosão de IA generativa tornou os bancos de dados vetoriais uma parte crucial dos aplicativos modernos. À medida que as empresas buscam soluções dimensionáveis e eficientes para pesquisa, recomendação e recuperação de conhecimento com base em IA, o AWS Bedrock e o Couchbase surgem como uma combinação atraente. O AWS Bedrock simplifica o acesso a modelos de base avançados, enquanto os recursos de armazenamento vetorial do Couchbase fornecem a eficiência de armazenamento e recuperação necessária para criar aplicativos de IA de alto desempenho.

Neste blog, exploramos como o armazenamento de vetores do Couchbase, quando integrado ao AWS Bedrock, cria uma solução de IA avançada, dimensionável e econômica. Também apresentaremos alguns detalhes importantes de implementação para ajudá-lo a começar.

Por que o AWS Bedrock + Couchbase?

Vamos nos aprofundar no valor exclusivo que cada componente oferece e como eles trabalham juntos para potencializar os aplicativos modernos de IA.

Acesso ininterrupto aos modelos de fundação

O AWS Bedrock oferece acesso a vários modelos de base sem a necessidade de gerenciamento extensivo da infraestrutura. Isso facilita para as empresas experimentarem, implantarem e dimensionarem aplicativos com tecnologia de IA sem se preocuparem com a complexidade subjacente da hospedagem e do ajuste fino do modelo.

Armazenamento vetorial escalável e econômico

Os recursos de armazenamento de vetores do Couchbase oferecem uma maneira rápida e eficiente de armazenar, recuperar e pesquisar embeddings. Com indexação integrada e consultas de alto desempenho, o Couchbase garante que os aplicativos orientados por IA possam lidar com a pesquisa vetorial em grande escala de forma eficiente.

Preenchendo a lacuna entre LLMs e dados corporativos

Ao combinar os recursos de inferência de modelos do AWS Bedrock com o banco de dados vetorial do Couchbase, as empresas podem criar aplicativos inteligentes que entendem e respondem às consultas dos usuários com alta precisão. Quer se trate de aplicativos de chatbot, pesquisa empresarial ou recomendações personalizadas, essa integração permite que a IA trabalhe perfeitamente com dados comerciais do mundo real.

Integração perfeita com o ecossistema da AWS

A Bedrock se integra sem esforço a outros serviços da AWS, como Lambda, S3 e API Gateway, permitindo fluxos de trabalho de IA sem servidor e de baixa latência.

A necessidade de sem servidor

As arquiteturas sem servidor oferecem uma série de benefícios que ajudarão naturalmente as soluções alimentadas por IA, incluindo:

    • Gerenciamento de infraestrutura zero - Não há necessidade de provisionar, dimensionar ou manter servidores, reduzindo a complexidade operacional e acelerando a implementação de IA.
    • Dimensionamento automático e eficiência de custos - Dimensiona dinamicamente com base na demanda, garantindo o desempenho ideal e seguindo um modelo de pagamento conforme o uso para minimizar os custos.
    • Integração perfeita e baixa latência - conecta-se facilmente aos serviços da AWS (Lambda, API Gateway) e fornece inferência de IA em tempo real com latência mínima.

Agora que já abordamos os benefícios e a arquitetura, vamos dar uma olhada em um exemplo prático que reúne tudo isso.

Um exemplo de aplicativo de bate-papo RAG PDF

Apresentamos uma demonstração de como integrar o AWS Bedrock ao Couchbase com um aplicativo de bate-papo do LLM. Esse aplicativo permite que você carregue seus próprios PDFs, e um pipeline RAG criado com o Couchbase permite que o LLM extraia dados de seus PDFs para responder às suas perguntas.

Uma discussão detalhada do diagrama pode ser encontrada em Bate-papo em PDF usando o tutorial sem servidor do AWS Bedrock. Em resumo, há dois fluxos: um que envolve a ingestão de dados em PDF e outro que diz respeito à interação do usuário com o aplicativo de bate-papo. Ao longo do caminho, usamos alguns serviços importantes do Couchbase que são essenciais para o aplicativo: eventos e pesquisa vetorial.

Eventos do Couchbase

O Eventing Service lida com alterações de dados que ocorrem quando os aplicativos interagem e tem esses recursos que ajudam os aplicativos de IA a prosperar:

    • Processamento de dados em tempo real - O Couchbase Eventing permite que você execute a lógica comercial em resposta a mutações de dados (inserções, atualizações, exclusões) em um bucket do Couchbase.
    • Assíncrono e dimensionável - O serviço Eventing é executado de forma assíncrona e é dimensionado de forma independente, garantindo o tratamento eficiente de cargas de trabalho de alto rendimento.
    • Integração com sistemas externos - Você pode acionar APIs externas, chamar microsserviços ou interagir com filas de mensagens usando funções de eventos.
    • Baixa latência e alto desempenho - Projetado para ter o mínimo de sobrecarga com acesso direto aos dados na memória.

Pesquisa vetorial do Couchbase

O Vector Search se baseia no Couchbase Capella's Serviço de busca para oferecer suporte a índices vetoriais. Você pode usar esses novos índices do Vector Search para Retrieval Augmented Generation (RAG) com um Large Language Model (LLM) existente, com esses benefícios arquitetônicos:

    • Pesquisa híbrida - Combina a pesquisa semântica com a filtragem tradicional de palavras-chave e metadados para obter resultados mais relevantes.
    • Baixa latência e alto desempenho - Otimizado para aplicativos de IA em tempo real, garantindo a recuperação rápida de itens semelhantes.
    • Integração perfeita com o Couchbase - É executado nativamente no Couchbase, permitindo armazenamento vetorial eficiente, indexação e recuperação juntamente com dados estruturados e não estruturados.

Também usamos outros serviços da AWS que complementam nosso aplicativo de várias maneiras, conforme discutido abaixo:

AWS Lambda

    • Gerenciamento de infraestrutura zero - basta carregar o código e ele é executado
    • Preços de pagamento por uso
    • Dimensionamento automático para lidar com picos de tráfego

Amazon SQS

    • Alta taxa de transferência de dados para lidar com grandes volumes de tráfego
    • Alta confiabilidade - não perde nenhuma mensagem

Amazon ECR

    • Casa segura e fácil de implementar para imagens de contêineres
    • Fácil integração entre os serviços do AWS
    • Garante um comportamento consistente entre os ambientes de desenvolvimento e produção

Para ler mais

 

Compartilhe este artigo
Receba atualizações do blog do Couchbase em sua caixa de entrada
Esse campo é obrigatório.

Autor

Postado por Gautham Krithiwas - Estagiário de engenharia de software

Deixe um comentário

Pronto para começar a usar o Couchbase Capella?

Iniciar a construção

Confira nosso portal do desenvolvedor para explorar o NoSQL, procurar recursos e começar a usar os tutoriais.

Use o Capella gratuitamente

Comece a trabalhar com o Couchbase em apenas alguns cliques. O Capella DBaaS é a maneira mais fácil e rápida de começar.

Entre em contato

Deseja saber mais sobre as ofertas do Couchbase? Deixe-nos ajudar.