Self-Hosted AI Chatbots with Docker and Couchbase Capella

Los chatbots de IA se han convertido en una herramienta esencial para empresas y organizaciones. Pero la mayoría de las soluciones de chatbot dependen de modelos basados en la nube que introducen latencia, limitaciones de API y, quizás lo más importante, problemas de privacidad. Qué pasaría si pudieras ejecutar un chatbot de IA completamente en tu máquina y seguir conservando el historial de conversaciones con una plataforma de datos con todas las funciones?

En este post, vamos a caminar a través de la creación de un chatbot AI auto-alojado utilizando Docker Model Runner, una nueva característica de Docker que le permite ejecutar modelos en contenedores a nivel local para la inferencia y más, y Couchbase Capella para almacenar, recuperar y buscar a través de las conversaciones. El resultado es un chatbot rápido, privado y flexible que tú controlas.

¿Listo para empezar? ¡Pongámonos en marcha!

Configuración de Docker Model Runner

En primer lugar, vamos a asegurarnos de que tu versión de Docker Desktop y CLI está actualizada para que tengas disponible la función Model Runner. Para ello, ejecute estado del modelo docker desde su terminal. Si tiene éxito, verá un mensaje de éxito emitido que Docker Model Runner se está ejecutando. Si no lo tienes, entonces necesitas primero obtener la última versión de Docker e instalarla. Después de actualizar Docker, puede ejecutar ese comando de nuevo y debería funcionar.

Una vez que lo hayas hecho, utilizarás Docker Model Runner para extraer la imagen del contenedor con el modelo Llama 3.2 y hacerla disponible localmente:

docker model pull ai/llama3.3

Puede comprobar que ha descargado correctamente el modelo Llama 3.2 ejecutando lista de modelos docker y verá el modelo disponible para su uso:

{"object":"list","data":[{"id":"ai/llama3.3","object":"model","created":1741794281,"owned_by":"docker"}]}

¿Quieres probarlo? Abrir el modelo en modo interactivo es muy fácil. Sólo tienes que ejecutar docker model run ai/llama3.3 desde la línea de comandos y entrará en modo interactivo:

Modo de chat interactivo iniciado. Escribe '/bye' para salir.>

Ahora que ya tienes Llama 3.2 descargado y listo para usar, es hora de crear una aplicación backend sencilla que aproveche el modelo para un chatbot de IA autoalojado.

Creación del chatbot

La aplicación que creará realizará las siguientes tareas:

- Ejecute Llama 3.2 localmente a través de la aplicación docker model run Comando CLI
- Enviar mensajes de usuario como avisos al modelo
- Almacenar el historial de chat en Couchbase Capella
- Recuperar chats anteriores

Su aplicación tendrá todas las características y estará lista para usar inmediatamente desde su consola como un robusto chatbot impulsado por IA. El código que construimos juntos aquí le proporcionará la base para refactorizarlo de acuerdo a cualquier necesidad que tenga. Tal vez, usted desea convertirlo en un backend para una aplicación web. Unas pocas modificaciones será todo lo que se requiere para hacer eso posible.

La aplicación requiere un par de dependencias así que desde el directorio del proyecto ejecute npm install couchbase readline-sync. Usamos el SDK de Couchbase Node.js para interactuar con nuestro almacén de datos Couchbase Capella, y usamos readline-sync para que la aplicación interactúe con el usuario desde el terminal.

Asegúrese de haber configurado un bucket en Capella para almacenar los datos del chat, y de tener a mano sus credenciales de Capella. Como siempre, no guarde sus credenciales en ningún control de versiones. Utilice variables de entorno para el desarrollo local para mantener sus credenciales seguras y no en manos públicas.

Estamos construyendo cuatro funciones en nuestra aplicación:

- askAI para encapsular el proceso de alimentación del mensaje a nuestro modelo de IA ejecutado localmente
- storeChat para enviar el historial de chat a Capella
- fetchChatHistory para recuperar los chats
- principal para actuar como interfaz principal de la aplicación

Empecemos por el principal que envolverá todo lo demás. Esta función creará un bucle del que el usuario podrá salir en cualquier momento ofreciendo una experiencia de chat continua:

async function main() {
 const { cluster, collection } = await connectToCouchbase();

  console.log("Self-Hosted AI Chatbot (Llama 3.2 + Capella)");
  console.log("Type your message below. Type 'history' to view past chats or 'exit' to quit.\n");

  while (true) {
    const userMessage = readlineSync.question("> ");

    if (userMessage.toLowerCase() === "exit") {
      console.log("Goodbye!");
      break;
    }

    if (userMessage.toLowerCase() === "history") {
      const history = await fetchChatHistory(cluster);
      console.log("\n📜 Chat History:");
      history.forEach((chat) => {
        console.log(`🧑 ${chat.user}\n🤖 ${chat.response}\n`);
      });
      continue;
    }

    console.log("🤖 Thinking...");
    const aiResponse = await askAI(userMessage);
    console.log(`🤖 ${aiResponse}\n`);

    await storeChat(collection, userMessage, aiResponse);
  }
}

async function main() {

const { cluster, collection } = await connectToCouchbase();

console.log("Self-Hosted AI Chatbot (Llama 3.2 + Capella)");

console.log("Type your message below. Type 'history' to view past chats or 'exit' to quit.\n");

while (true) {

const userMessage = readlineSync.question("> ");

if (userMessage.toLowerCase() === "exit") {

console.log("Goodbye!");

break;

}

if (userMessage.toLowerCase() === "history") {

const history = await fetchChatHistory(cluster);

console.log("\n📜 Chat History:");

history.forEach((chat) => {

console.log(`🧑 ${chat.user}\n🤖 ${chat.response}\n`);

});

continue;

}

console.log("🤖 Thinking...");

const aiResponse = await askAI(userMessage);

console.log(`🤖 ${aiResponse}\n`);

await storeChat(collection, userMessage, aiResponse);

}

Como puede ver, hemos introducido una funcionalidad construida sobre el almacén de datos de Capella, a saber, la capacidad de recuperar dentro del propio chat el historial de chat anterior. Esto podría ser útil para que un usuario recupere su contexto de chat cada vez que inicie una nueva sesión.

Ahora que tenemos el principal vamos a crear las funciones de apoyo que invoca, empezando por la función askAI función:

async function askAI(prompt) {
  return new Promise((resolve, reject) => {
    exec(
      `docker model run ai/llama3.3 "${prompt}"`,
      (error, stdout, stderr) => {
        if (error) {
          console.error(`Error running model: ${error.message}`);
          reject(error);
        }
        if (stderr) {
         console.error(`Docker stderr: ${stderr}`);
        }
        resolve(stdout.trim()); // Return AI response
      }
    );
  });
}

async function askAI(prompt) {

return new Promise((resolve, reject) => {

exec(

`docker model run ai/llama3.3 "${prompt}"`,

(error, stdout, stderr) => {

if (error) {

console.error(`Error running model: ${error.message}`);

reject(error);

}

if (stderr) {

console.error(`Docker stderr: ${stderr}`);

}

resolve(stdout.trim()); // Return AI response

}

);

});

}

A continuación, el storeChat función:

async function storeChat(collection, userMessage, aiResponse) {
  const chatDoc = {
    user: userMessage,
    response: aiResponse,
    timestamp: new Date().toISOString(),
  };

  await collection.upsert(`chat_${Date.now()}`, chatDoc);
}

async function storeChat(collection, userMessage, aiResponse) {

const chatDoc = {

user: userMessage,

response: aiResponse,

timestamp: new Date().toISOString(),

};

await collection.upsert(`chat_${Date.now()}`, chatDoc);

}

Por último, el fetchChatHistory función:

async function fetchChatHistory(cluster, limit = 5) {
  const query = `
    SELECT user, response, timestamp FROM `chatbot`
    ORDER BY timestamp DESC
    LIMIT ${limit};
  `;
  const result = await cluster.query(query);
  return result.rows;
}

async function fetchChatHistory(cluster, limit = 5) {

const query = `

SELECT user, response, timestamp FROM `chatbot`

ORDER BY timestamp DESC

LIMIT ${limit};

const result = await cluster.query(query);

return result.rows;

}

Una vez que haya terminado con las funciones, asegúrese de añadir requiere al principio del archivo, y para crear una conexión con el clúster Couchbase Capella:

const { exec } = require("child_process");
const readlineSync = require("readline-sync");
const couchbase = require("couchbase");
require("dotenv").config();

async function connectToCouchbase() {
  try {
    const cluster = await couchbase.connect(COUCHBASE_URL, {
      username: COUCHBASE_USERNAME,
      password: COUCHBASE_PASSWORD,
    });
    const bucket = cluster.bucket("chatbot");
    const collection = bucket.defaultCollection();
    console.log("Connected to Couchbase Capella");
    return { cluster, collection };
  } catch (err) {
    console.error("Failed to connect to Couchbase:", err);
    process.exit(1);
  }
}

const { exec } = require("child_process");

const readlineSync = require("readline-sync");

const couchbase = require("couchbase");

require("dotenv").config();

async function connectToCouchbase() {

try {

const cluster = await couchbase.connect(COUCHBASE_URL, {

username: COUCHBASE_USERNAME,

password: COUCHBASE_PASSWORD,

});

const bucket = cluster.bucket("chatbot");

const collection = bucket.defaultCollection();

console.log("Connected to Couchbase Capella");

return { cluster, collection };

} catch (err) {

console.error("Failed to connect to Couchbase:", err);

process.exit(1);

}

Por último, no olvide añadir una línea al final del script que llame a la función principal insertando main(); en la última línea.

Una vez finalizado, dispondrá de un chatbot de IA totalmente listo alojado en su propia máquina, conservando su privacidad y aprovechando simultáneamente Capella para el almacenamiento y la recuperación.

Uso de su chatbot de IA autoalojado

¡Tu propio chatbot está listo para usar! Cada consulta que le envíes será procesada únicamente de forma local en tu máquina utilizando el modelo Llama 3.2. No se enviará nada a ningún proveedor de IA de forma remota.

Si estás listo para darle una vuelta, hazlo ejecutando lo siguiente:

node index.js # o como haya llamado a su archivo

Una vez que lo ejecutes, verás lo siguiente:

Conectado a Couchbase Capella

Chatbot AI autoalojado (Llama 3.2 + Capella)

Escribe tu mensaje a continuación. Escribe 'historial' para ver chats anteriores o 'salir' para salir.

>

Adelante, empieza a hacer preguntas y a interactuar con él. Aquí tienes un breve ejemplo de lo que puedes esperar ver:

Connected to Couchbase Capella

🚀 Self-Hosted AI Chatbot (Llama 3.2 + Capella)
Type your message below. Type 'history' to view past chats or 'exit' to quit.

> Should I pack a raincoat for Barcelona for a trip there at the end of March? Answer only with "yes" or "no".
🤖 Thinking...
🤖 Yes.

> Tell me why I should pack a raincoat for Barcelona at the end of March. Limit your answer to 15 words or less.
🤖 Thinking...
🤖 You may need a raincoat as March weather in Barcelona can be unpredictable and rainy, up to 10C.

> exit
👋 Goodbye!

Connected to Couchbase Capella

🚀 Self-Hosted AI Chatbot (Llama 3.2 + Capella)

Type your message below. Type 'history' to view past chats or 'exit' to quit.

> Should I pack a raincoat for Barcelona for a trip there at the end of March? Answer only with "yes" or "no".

🤖 Thinking...

🤖 Yes.

> Tell me why I should pack a raincoat for Barcelona at the end of March. Limit your answer to 15 words or less.

🤖 Thinking...

🤖 You may need a raincoat as March weather in Barcelona can be unpredictable and rainy, up to 10C.

> exit

👋 Goodbye!

Al usar la escalabilidad y seguridad de Couchbase Capella junto con el enfoque de privacidad de Docker Model Runner para ejecutar modelos de IA localmente, puedes crear aplicaciones de IA dinámicas que prioricen la privacidad del usuario. Ejecutar modelos en tu propia máquina también te ofrece una inferencia más rápida, control total sobre la personalización de las solicitudes, la capacidad de almacenar metadatos adicionales y la flexibilidad para ajustar el comportamiento de tu chatbot, todo dentro de tu propio entorno.

Esta combinación de Capella y Docker Model Runner le ofrece la velocidad, el control y la privacidad necesarios para crear aplicaciones de IA sin depender de API externas. Tanto si está creando un chatbot, analizando datos o ejecutando flujos de trabajo basados en IA, esta configuración garantiza que todo lo que cree será eficiente, escalable y estará totalmente bajo su control.

La única pregunta es: ¿qué va a construir?

- Conéctese con nuestra comunidad de desarrolladores ¡y muéstranos lo que estás construyendo!

Ben Greenberg, Desarrollador Evangelista Senior

Comparte este artículo

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

Chatbots de IA autoalojados con Docker y Couchbase Capella

Configuración de Docker Model Runner

Creación del chatbot

Uso de su chatbot de IA autoalojado

Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada

Autor

Publicado por Ben Greenberg, Desarrollador Evangelista Senior

Deja un comentario Cancelar respuesta

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Utilizar Capella gratis

Póngase en contacto