IA generativa (GenAI)

Crie seu primeiro agente de IA de código aberto com o Couchbase

Se 2024 foi o ano dos chatbots de IA, então 2025 é o ano dos agentes de IA. À primeira vista, eles podem parecer semelhantes, mas nada poderia estar mais longe da verdade. Embora você possa interagir com um agente de IA da mesma forma que interage com um chatbot de IA, talvez por meio de uma interface da Web, as diferenças entre eles são gritantes.

Os agentes de IA podem agir de forma autônoma para atender à sua solicitação. É isso mesmo, eu disse isso: de forma autônoma. IA agindo em seu nome, descobrindo o que fazer e quais devem ser as próximas etapas sem sua intervenção.

Quer encontrar um bom restaurante para um encontro noturno e reservar uma mesa? Deixe seu agente de IA fazer isso por você, desde a pesquisa até a reserva.

Precisa rastrear o envolvimento de novos clientes em seu CRM e enviar e-mails personalizados? Deixe seu agente de IA fazer isso por você, desde o rastreamento até a composição do e-mail e o envio.

Basicamente, os agentes podem fazer praticamente tudo para você on-line. Você pode até mesmo ter vários agentes trabalhando em conjunto. Tudo o que eles precisam é de um tarefa que você lhes deu, e eles vão concluir essa tarefa.

Você pode pensar que a criação ou o uso de IA agêntica custará uma fortuna, e você não estaria errado em pensar assim. As empresas, algumas das maiores do setor, estão oferecendo esses serviços por taxas mensais muito altas. No entanto, com algum conhecimento de Python e JavaScript, você pode criar uma interface de usuário da Web de agente de IA de pilha completa gratuitamente. E o melhor de tudo é que você pode incorporar facilmente o Couchbase para obter recursos de armazenamento de dados, recuperação e pesquisa de texto completo de alto desempenho. O Couchbase Capella, o banco de dados totalmente gerenciado como serviço, oferece até mesmo uma camada totalmente gratuita para sempre, que você pode usar em seu aplicativo.

Isso despertou seu interesse? Bem, ótimas notícias! Você nem precisa criá-lo do zero. Você pode encontrar o aplicativo completo em meu agente de navegador de código aberto Repositório do GitHubcom instruções sobre como começar a usá-lo. 

Vamos dar uma olhada na arquitetura do aplicativo e em como ele foi criado. Uma melhor compreensão de como ele funciona permitirá que você o adapte para seu próprio caso de uso pessoal.

O aplicativo é composto por um frontend React e um backend Python. Vamos nos concentrar no backend, pois é nele que o trabalho do agente e as interações com o Couchbase acontecem. Você pode explorar o frontend livremente no GitHub, que oferece um design que prioriza os dispositivos móveis.

Explorando como ele funciona

A base desse aplicativo é uma mistura harmoniosa de um front-end React e um back-end Python. Enquanto o front-end garante uma experiência de usuário suave e responsiva, o back-end é onde o agente de IA opera, lidando com as solicitações do usuário e interagindo com o Couchbase para o gerenciamento de dados.

O agente de IA com uso do navegador

No centro do agente de IA está a integração do biblioteca Python de código aberto do Browser Use. Essa biblioteca permite que o agente execute uma variedade de tarefas simulando ações do navegador. Seja navegando no site de um restaurante para reservar uma mesa ou acessando o CRM para rastrear o envolvimento dos clientes, o Browser Use fornece as ferramentas necessárias para que o agente interaja com os recursos da Web de forma eficaz.

A inicialização de um agente de IA do Browser Use requer apenas algumas linhas de código em seu backend Python:

O agente é instanciado com vários parâmetros, incluindo:

    • A tarefa específica que você deseja que ele faça
    • O grande modelo de linguagem que ele usará para analisar os resultados de sua pesquisa independente (o projeto atualmente oferece suporte a Anthropic, OpenAI, DeepSeek, Qwen, Azure, Gemini e outros)
    • Um valor booleano para visãoque dá ao agente a capacidade de também analisar imagens de sua pesquisa
    • O número de falhas que você tolerará antes de encerrar a tarefa sem sucesso 
    • Quanto tempo esperar, em segundos, entre as novas tentativas
    • Quantas etapas você dá permissão para o agente executar para tentar concluir a tarefa

O restante do código para instanciar o agente se preocupa apenas em retornar os resultados. 

Isso é tudo o que é necessário para criar um agente e colocá-lo no mundo. Algumas linhas de Python, na verdade.

Quando o agente de IA recebe uma tarefa, como reservar um restaurante ou enviar e-mails personalizados, ele utiliza a biblioteca Browser Use para executar as ações necessárias on-line. Isso envolve a navegação em sites, o preenchimento de formulários e até mesmo a análise de informações, tudo executado de forma programática para atender às solicitações do usuário com eficiência.

A persistência e a pesquisa de dados são recursos fundamentais dos aplicativos modernos. Você pode não só persistir os dados para fins de usuário, como o histórico de bate-papo, mas também fornecer mais contexto ao seu agente com os dados persistidos por meio de uma metodologia chamada Geração Aumentada de Recuperação (RAG). Recomendo a leitura de este artigo se você estiver interessado em explorar esse tópico mais a fundo.

Por enquanto, vamos introduzir a persistência de dados e a funcionalidade de pesquisa na interface de usuário do agente com o Couchbase.

Interagindo com o Couchbase para pesquisa de texto completo

O Couchbase desempenha um papel fundamental no gerenciamento e na recuperação eficiente dos dados de bate-papo. Aproveitando os recursos do Couchbase Full Text Search (FTS), o backend pode pesquisar rapidamente em extensos históricos de bate-papo para encontrar conversas relevantes com base nas consultas do usuário. Aqui está um exemplo simplificado de como o backend interage com o Couchbase para FTS usando o Couchbase Python SDK:

Nesse trecho, o search_chats é fundamental na recuperação de conversas de bate-papo relevantes com base na entrada do usuário. Quando um usuário insere uma consulta de pesquisa, a função constrói uma solicitação de pesquisa direcionada ao índice do FTS no Couchbase. Ela especifica os campos a serem recuperados, garantindo que todas as informações necessárias, como chat_id, user_id, nomee mensagem detalhes, são incluídos nos resultados da pesquisa.

À medida que a função processa cada resultado de pesquisa, ela organiza meticulosamente o conteúdo da mensagem, os registros de data e hora e os remetentes, garantindo que a estrutura de dados permaneça consistente e confiável. Esse tratamento cuidadoso garante que o front-end receba dados bem estruturados, prontos para serem exibidos ao usuário sem nenhum problema.

A interação entre o agente de IA e o Couchbase garante que todas as interações do usuário sejam armazenadas com segurança e possam ser recuperadas rapidamente quando necessário. Seja para buscar históricos de bate-papo ou atualizar as preferências do usuário, o Couchbase oferece a escalabilidade e o desempenho necessários para lidar com uma base crescente de usuários sem comprometer a velocidade ou a confiabilidade.

Quando um usuário inicia uma pesquisa no frontend, o aplicativo React envia a consulta para o backend. O agente de IA processa essa solicitação, interage com o Couchbase para buscar os bate-papos relevantes e envia os resultados de volta para o frontend. Essa viagem de ida e volta garante que os usuários recebam informações precisas e oportunas, aprimorando sua experiência geral com o aplicativo.

Ao combinar os recursos da biblioteca Browser Use com os recursos de gerenciamento de dados do Couchbase, o aplicativo oferece uma experiência abrangente de agente de IA. Os usuários podem gerenciar suas tarefas on-line, participar de conversas significativas com seu agente e confiar no sistema para lidar com operações complexas nos bastidores.

Essa arquitetura não apenas fornece funcionalidade imediata, mas também estabelece uma base sólida para aprimoramentos futuros. À medida que o aplicativo evolui, a integração entre o frontend, o agente de IA e o Couchbase garante que ele permaneça adaptável, dimensionável e responsivo às necessidades do usuário.

Concluindo

Na próxima vez que você vir serviços de agentes de IA em plena atividade e sentir o FOMO porque seu cartão de crédito não aguenta a conta mensal, lembre-se de que, com apenas um pouco de Python e um pouco de JavaScript, você pode ter seu próprio agente à sua disposição. 

Quer começar? Acesse o projeto em GitHubclone-o em seu computador e siga as instruções no LEIAME para experimentá-lo.

Que tarefas que economizam tempo você pedirá que seu agente faça por você? Junte-se a nós em nossa comunidade ativa e crescente no Discord para compartilhar o que você criou!

Compartilhe este artigo
Receba atualizações do blog do Couchbase em sua caixa de entrada
Esse campo é obrigatório.

Author

Posted by Ben Greenberg, desenvolvedor sênior evangelista

Deixe um comentário

Pronto para começar a usar o Couchbase Capella?

Iniciar a construção

Confira nosso portal do desenvolvedor para explorar o NoSQL, procurar recursos e começar a usar os tutoriais.

Use o Capella gratuitamente

Comece a trabalhar com o Couchbase em apenas alguns cliques. O Capella DBaaS é a maneira mais fácil e rápida de começar.

Entre em contato

Deseja saber mais sobre as ofertas do Couchbase? Deixe-nos ajudar.