IA Generativa (GenAI)

Cree su primer agente de IA de código abierto con Couchbase

Si 2024 fue el año de los chatbots de IA, 2025 es el año de los agentes de IA. A primera vista, pueden parecer similares, pero nada más lejos de la realidad. Aunque se puede interactuar con un agente de IA de la misma manera que con un chatbot de IA, quizás a través de una interfaz web, las diferencias entre ellos son notables.

Los agentes de IA pueden actuar de forma autónoma para satisfacer su petición. Así es, lo he dicho: de forma autónoma. Una IA que actúa en tu nombre y decide qué hacer y cuáles deben ser sus próximos pasos sin tu intervención.

¿Quiere encontrar un buen restaurante para una cita nocturna y reservar mesa? Deja que tu agente de IA lo haga por ti, desde la búsqueda hasta la reserva.

¿Necesita realizar un seguimiento de las interacciones con nuevos clientes en su CRM y enviar correos electrónicos personalizados? Deje que su agente de IA lo haga por usted, desde el seguimiento hasta la redacción del correo electrónico y su envío.

Esencialmente, los agentes pueden hacer casi cualquier cosa por usted en línea. Incluso puede tener varios agentes trabajando en tándem. Todo lo que necesitan es un tarea que les propongas y ellos se encargarán de completar esa tarea.

Es posible que piense que construir o utilizar IA agéntica le costará una fortuna, y no se equivocaría al pensar eso. Las empresas, algunas de las más importantes del sector, ofrecen estos servicios por cuotas mensuales muy elevadas. Sin embargo, con un poco de conocimiento de Python y JavaScript, puede construir una interfaz de usuario web de agente de IA de pila completa de forma gratuita. Lo mejor de todo es que puedes incorporar fácilmente Couchbase para el almacenamiento de datos de alto rendimiento, recuperación y capacidades de búsqueda de texto completo. Couchbase Capella, la base de datos totalmente gestionada como servicio, incluso ofrece un nivel gratuito para siempre, que puedes utilizar en tu aplicación.

¿He despertado su interés? Buenas noticias. Ni siquiera tienes que construirlo desde cero. Puedes encontrar la aplicación completa en mi agente navegador de código abierto repositorio GitHubcon instrucciones para empezar a utilizarlo. 

Veamos la arquitectura de la aplicación y cómo está construida. Una mejor comprensión de su funcionamiento le permitirá adaptarla a su caso de uso personal.

La aplicación se compone de un frontend React y un backend Python. Nos centraremos en el backend ya que es donde ocurre el trabajo del agente y las interacciones con Couchbase. Puedes explorar el frontend libremente en GitHub, que ofrece un diseño mobile-first.

Cómo funciona

La base de esta aplicación es una mezcla armoniosa de un frontend React y un backend Python. Mientras que el frontend garantiza una experiencia de usuario fluida y receptiva, el backend es donde opera el agente de IA, gestionando las solicitudes de los usuarios e interactuando con Couchbase para la gestión de datos.

El agente de IA con uso de navegador

En el núcleo del agente de IA está la integración de la biblioteca Python de código abierto de Browser Use. Esta biblioteca permite al agente realizar diversas tareas simulando las acciones del navegador. Tanto si se trata de navegar por el sitio web de un restaurante para reservar una mesa como de acceder al CRM para realizar un seguimiento de los compromisos de los clientes, Browser Use proporciona las herramientas necesarias para que el agente interactúe con los recursos web de forma eficaz.

Inicializar un agente Browser Use AI sólo requiere unas pocas líneas de código en tu backend Python:

El Agente es instanciado con varios parámetros, incluyendo:

    • La tarea específica que desea que realice
    • El gran modelo lingüístico que utilizará para analizar los resultados de su investigación independiente (el proyecto es compatible actualmente con Anthropic, OpenAI, DeepSeek, Qwen, Azure, Gemini y otros).
    • Un valor booleano para visiónque permite al agente analizar también las imágenes de su investigación.
    • El número de fallos que tolerará antes de salir de la tarea sin éxito. 
    • Cuánto tiempo esperar en segundos entre reintentos
    • Cuántos pasos autoriza a ejecutar al agente para intentar completar la tarea.

El resto del código para instanciar el agente sólo se ocupa de devolver los resultados. 

Eso es todo lo que se necesita para crear un agente y ponerlo en el mundo. Unas pocas líneas de Python, en realidad.

Cuando el agente de IA recibe una tarea, como reservar un restaurante o enviar correos electrónicos personalizados, utiliza la biblioteca Browser Use para realizar las acciones necesarias en línea. Esto implica navegar por sitios web, rellenar formularios e incluso analizar información, todo ello ejecutado mediante programación para satisfacer las peticiones de los usuarios de forma eficiente.

La persistencia y la búsqueda de datos son características fundamentales de las aplicaciones modernas. No sólo puede persistir los datos para fines de usuario, como el historial de chat, sino que también podría proporcionar más contexto a su agente con los datos persistidos con una metodología llamada Generación de Recuperación Aumentada (RAG). Recomiendo leer este artículo si le interesa profundizar en este tema.

Por ahora, vamos a introducir la persistencia de datos y la funcionalidad de búsqueda en la interfaz de usuario de tu agente con Couchbase.

Interacción con Couchbase para la búsqueda de texto completo

Couchbase desempeña un papel fundamental en la gestión y recuperación eficiente de datos de chat. Aprovechando las capacidades de Couchbase Full Text Search (FTS), el backend puede buscar rápidamente a través de extensos historiales de chat para encontrar conversaciones relevantes basadas en las consultas de los usuarios. Este es un ejemplo simplificado de cómo el backend interactúa con Couchbase para FTS usando el Couchbase Python SDK:

En este fragmento, el buscar_chats es fundamental para recuperar conversaciones de chat relevantes basadas en la entrada del usuario. Cuando un usuario introduce una consulta de búsqueda, la función construye una solicitud de búsqueda dirigida al índice FTS dentro de Couchbase. Especifica los campos a recuperar, asegurándose de que toda la información necesaria, como chat_id, usuario_id, nombrey mensaje se incluyen en los resultados de la búsqueda.

A medida que la función procesa cada resultado de búsqueda, organiza meticulosamente el contenido del mensaje, las marcas de tiempo y los remitentes, asegurándose de que la estructura de datos se mantiene coherente y fiable. Esta cuidadosa gestión garantiza que el frontend reciba datos bien estructurados, listos para mostrarse al usuario sin ningún contratiempo.

La interacción entre el agente de IA y Couchbase garantiza que todas las interacciones del usuario se almacenen de forma segura y puedan recuperarse rápidamente cuando sea necesario. Couchbase ofrece la escalabilidad y el rendimiento necesarios para gestionar una base de usuarios en crecimiento sin comprometer la velocidad ni la fiabilidad, ya se trate de recuperar historiales de chat o de actualizar las preferencias de los usuarios.

Cuando un usuario inicia una búsqueda desde el frontend, la aplicación React envía la consulta al backend. El agente de IA procesa esta solicitud, interactúa con Couchbase para obtener los chats relevantes y devuelve los resultados al frontend. Este viaje de ida y vuelta garantiza que los usuarios reciban información precisa y oportuna, mejorando su experiencia general con la aplicación.

Al combinar las capacidades de la biblioteca Browser Use con las funciones de gestión de datos de Couchbase, la aplicación ofrece una experiencia de agente de IA completa. Los usuarios pueden gestionar sus tareas en línea, entablar conversaciones significativas con su agente y confiar en el sistema para gestionar operaciones complejas entre bastidores.

Esta arquitectura no sólo proporciona una funcionalidad inmediata, sino que también sienta unas bases sólidas para futuras mejoras. A medida que la aplicación evoluciona, la integración entre el frontend, el agente de IA y Couchbase garantiza su adaptabilidad, escalabilidad y capacidad de respuesta a las necesidades de los usuarios.

Conclusión

La próxima vez que veas servicios de agentes de IA en la naturaleza y sientas el FOMO porque tu tarjeta de crédito no puede soportar la factura mensual, recuerda que con sólo un poco de Python y un poco de JavaScript, puedes tener tu propio agente a tu disposición. 

¿Quieres empezar? Visite el proyecto en GitHubclónalo en tu ordenador y sigue las instrucciones del LÉAME para probarlo.

¿Qué tareas de ahorro de tiempo hará que su agente haga por usted? Únete a nuestra activa y creciente comunidad de Discord para compartir lo que has creado.

Comparte este artículo
Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada
Este campo es obligatorio.

Autor

Publicado por Ben Greenberg, Desarrollador Evangelista Senior

Deja un comentario

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Consulte nuestro portal para desarrolladores para explorar NoSQL, buscar recursos y empezar con tutoriales.

Utilizar Capella gratis

Ponte manos a la obra con Couchbase en unos pocos clics. Capella DBaaS es la forma más fácil y rápida de empezar.

Póngase en contacto

¿Quieres saber más sobre las ofertas de Couchbase? Permítanos ayudarle.