A explosão de IA generativa tornou os bancos de dados vetoriais uma parte crucial dos aplicativos modernos. À medida que as empresas buscam soluções dimensionáveis e eficientes para pesquisa, recomendação e recuperação de conhecimento com base em IA, o AWS Bedrock e o Couchbase surgem como uma combinação atraente. O AWS Bedrock simplifica o acesso a modelos de base avançados, enquanto os recursos de armazenamento vetorial do Couchbase fornecem a eficiência de armazenamento e recuperação necessária para criar aplicativos de IA de alto desempenho.
Neste blog, exploramos como o armazenamento de vetores do Couchbase, quando integrado ao AWS Bedrock, cria uma solução de IA avançada, dimensionável e econômica. Também apresentaremos alguns detalhes importantes de implementação para ajudá-lo a começar.
Por que o AWS Bedrock + Couchbase?
Vamos nos aprofundar no valor exclusivo que cada componente oferece e como eles trabalham juntos para potencializar os aplicativos modernos de IA.
Acesso ininterrupto aos modelos de fundação
O AWS Bedrock oferece acesso a vários modelos de base sem a necessidade de gerenciamento extensivo da infraestrutura. Isso facilita para as empresas experimentarem, implantarem e dimensionarem aplicativos com tecnologia de IA sem se preocuparem com a complexidade subjacente da hospedagem e do ajuste fino do modelo.
Armazenamento vetorial escalável e econômico
Os recursos de armazenamento de vetores do Couchbase oferecem uma maneira rápida e eficiente de armazenar, recuperar e pesquisar embeddings. Com indexação integrada e consultas de alto desempenho, o Couchbase garante que os aplicativos orientados por IA possam lidar com a pesquisa vetorial em grande escala de forma eficiente.
Preenchendo a lacuna entre LLMs e dados corporativos
Ao combinar os recursos de inferência de modelos do AWS Bedrock com o banco de dados vetorial do Couchbase, as empresas podem criar aplicativos inteligentes que entendem e respondem às consultas dos usuários com alta precisão. Quer se trate de aplicativos de chatbot, pesquisa empresarial ou recomendações personalizadas, essa integração permite que a IA trabalhe perfeitamente com dados comerciais do mundo real.
Integração perfeita com o ecossistema da AWS
A Bedrock se integra sem esforço a outros serviços da AWS, como Lambda, S3 e API Gateway, permitindo fluxos de trabalho de IA sem servidor e de baixa latência.
A necessidade de sem servidor
As arquiteturas sem servidor oferecem uma série de benefícios que ajudarão naturalmente as soluções alimentadas por IA, incluindo:
-
- Gerenciamento de infraestrutura zero - Não há necessidade de provisionar, dimensionar ou manter servidores, reduzindo a complexidade operacional e acelerando a implementação de IA.
- Dimensionamento automático e eficiência de custos - Dimensiona dinamicamente com base na demanda, garantindo o desempenho ideal e seguindo um modelo de pagamento conforme o uso para minimizar os custos.
- Integração perfeita e baixa latência - conecta-se facilmente aos serviços da AWS (Lambda, API Gateway) e fornece inferência de IA em tempo real com latência mínima.
Agora que já abordamos os benefícios e a arquitetura, vamos dar uma olhada em um exemplo prático que reúne tudo isso.
Um exemplo de aplicativo de bate-papo RAG PDF
Apresentamos uma demonstração de como integrar o AWS Bedrock ao Couchbase com um aplicativo de bate-papo do LLM. Esse aplicativo permite que você carregue seus próprios PDFs, e um pipeline RAG criado com o Couchbase permite que o LLM extraia dados de seus PDFs para responder às suas perguntas.
-
- Encontre o código em este repositório do GitHub.
Uma discussão detalhada do diagrama pode ser encontrada em Bate-papo em PDF usando o tutorial sem servidor do AWS Bedrock. Em resumo, há dois fluxos: um que envolve a ingestão de dados em PDF e outro que diz respeito à interação do usuário com o aplicativo de bate-papo. Ao longo do caminho, usamos alguns serviços importantes do Couchbase que são essenciais para o aplicativo: eventos e pesquisa vetorial.
Eventos do Couchbase
O Eventing Service lida com alterações de dados que ocorrem quando os aplicativos interagem e tem esses recursos que ajudam os aplicativos de IA a prosperar:
-
- Processamento de dados em tempo real - O Couchbase Eventing permite que você execute a lógica comercial em resposta a mutações de dados (inserções, atualizações, exclusões) em um bucket do Couchbase.
- Assíncrono e dimensionável - O serviço Eventing é executado de forma assíncrona e é dimensionado de forma independente, garantindo o tratamento eficiente de cargas de trabalho de alto rendimento.
- Integração com sistemas externos - Você pode acionar APIs externas, chamar microsserviços ou interagir com filas de mensagens usando funções de eventos.
- Baixa latência e alto desempenho - Projetado para ter o mínimo de sobrecarga com acesso direto aos dados na memória.
Pesquisa vetorial do Couchbase
O Vector Search se baseia no Couchbase Capella's Serviço de busca para oferecer suporte a índices vetoriais. Você pode usar esses novos índices do Vector Search para Retrieval Augmented Generation (RAG) com um Large Language Model (LLM) existente, com esses benefícios arquitetônicos:
-
- Pesquisa híbrida - Combina a pesquisa semântica com a filtragem tradicional de palavras-chave e metadados para obter resultados mais relevantes.
- Baixa latência e alto desempenho - Otimizado para aplicativos de IA em tempo real, garantindo a recuperação rápida de itens semelhantes.
- Integração perfeita com o Couchbase - É executado nativamente no Couchbase, permitindo armazenamento vetorial eficiente, indexação e recuperação juntamente com dados estruturados e não estruturados.
Também usamos outros serviços da AWS que complementam nosso aplicativo de várias maneiras, conforme discutido abaixo:
AWS Lambda
-
- Gerenciamento de infraestrutura zero - basta carregar o código e ele é executado
- Preços de pagamento por uso
- Dimensionamento automático para lidar com picos de tráfego
Amazon SQS
-
- Alta taxa de transferência de dados para lidar com grandes volumes de tráfego
- Alta confiabilidade - não perde nenhuma mensagem
Amazon ECR
-
- Casa segura e fácil de implementar para imagens de contêineres
- Fácil integração entre os serviços do AWS
- Garante um comportamento consistente entre os ambientes de desenvolvimento e produção
Para ler mais
-
- Explore o AWS Bedrock
- Saiba mais sobre AWS Lambda, Amazon SQS, Amazon ECR
- Confira Couchbase Capella, um banco de dados gerenciado e comece a usá-lo hoje mesmo gratuitamente!