Twitter Thread tl;dr With AI? Part 2

En parte 1 vimos cómo scrapear Twitter, convertir tweets en documentos JSON, obtener una representación incrustada de ese tweet, almacenarlo todo en Couchbase y cómo ejecutar una búsqueda vectorial. Estos son los primeros pasos de una arquitectura de Generación Aumentada de Recuperación que podría resumir un hilo de Twitter. El siguiente paso es utilizar un Modelo de Lenguaje Grande. Podemos pedirle que resuma el hilo, y podemos enriquecer el contexto de la petición gracias a la Búsqueda Vectorial.

LangChain y Streamlit

Entonces, ¿cómo hacer que todo esto funcione con un LLM? Ahí es donde el proyecto LangChain puede ayudar. Su objetivo es permitir a los desarrolladores crear aplicaciones basadas en LLM. Ya tenemos algunos ejemplos disponibles en GitHub que muestran nuestro módulo LangChain. Como esta demo de RAG que permite al usuario subir un PDF, vectorizarlo, almacenarlo en Couchbase y utilizarlo en un chatbot. Ese está en JavaScript, pero también hay un Versión Python.

Resulta que esto es exactamente lo que quiero hacer, salvo que utiliza un PDF en lugar de una lista de tweets. Así que lo bifurqué y empezó a jugar con él aquí. Aquí, Nithish está usando un par de librerías interesantes, LangChain por supuesto, y Streamlit. ¡Otra cosa interesante que aprender! Streamlit es como un PaaS, código reducido y ciencia de datos servicio. Permite desplegar aplicaciones basadas en datos muy fácilmente, con un mínimo de código, de una forma muy, muy opinable.

Configuración

Vamos a dividir el código en trozos más pequeños. Podemos empezar con la configuración. El siguiente método se asegura de que las variables de entorno correctas están configuradas, y detiene el despliegue de la aplicación si no lo están.

En comprobar_variable_entorno es llamado varias veces para asegurarse de que se ha establecido la configuración necesaria, y si no se detendrá la aplicación.

def check_environment_variable(variable_name):
"""Check if environment variable is set"""
if variable_name not in os.environ:
    st.error(f"{variable_name} environment variable is not set. Please add it to the secrets.toml file")
    st.stop()

def comprobar_variable_entorno(nombre_variable):

"""Comprobar si la variable de entorno está establecida"""

si nombre_variable no en os.environ:

st.error(f"La variable de entorno {variable_name} no está configurada. Por favor, añádala al archivo secrets.toml")

st.stop()

 	check_environment_variable("OPENAI_API_KEY") # The OpenApi API Key I have created and user earlier
   	check_environment_variable("DB_CONN_STR") # A connection string to connect to Couchbase, like couchbase://localhost or couchbases://cb.abab-abab.cloud.couchbase.com
   	check_environment_variable("DB_USERNAME") # Username
   	check_environment_variable("DB_PASSWORD") # And password to connect to Couchbase
   	check_environment_variable("DB_BUCKET") # The name of the bucket containing our scopes and collection
   	check_environment_variable("DB_SCOPE") # Scope
   	check_environment_variable("DB_COLLECTION") # and collection name, you can think of a collection as a table in RDBMS
   	check_environment_variable("INDEX_NAME") # The name of the search vector index

comprobar_variable_entorno("OPENAI_API_KEY") # La clave de la API OpenApi que he creado y utilizado anteriormente

comprobar_variable_entorno("DB_CONN_STR") # Una cadena de conexión para conectarse a Couchbase, como couchbase://localhost o couchbases://cb.abab-abab.cloud.couchbase.com

comprobar_variable_entorno("DB_USERNAME) # Nombre de usuario

comprobar_variable_entorno("DB_PASSWORD") # Y contraseña para conectarse a Couchbase

comprobar_variable_entorno("DB_BUCKET") # El nombre del bucket que contiene nuestros ámbitos y colecciones

comprobar_variable_entorno("DB_SCOPE") Ámbito #

comprobar_variable_entorno("DB_COLLECTION") # y el nombre de la colección, se puede pensar en una colección como una tabla en RDBMS

comprobar_variable_entorno("INDEX_NAME") # Nombre del índice del vector de búsqueda

Esto significa que todo lo que hay ahí es necesario. Una conexión a OpenAI y a Couchbase. Hablemos rápidamente de Couchbase. Es un JSON, base de datos distribuida multi-modelo con una caché integrada. Puedes usarla como K/V, SQL, Búsqueda de texto completo, Series temporales, Analítica, y hemos añadido fantásticas nuevas características en 7.6: CTEs recursivas para hacer consultas gráficas, o la que más nos interesa hoy, Búsqueda vectorial. La forma más rápida de probarlo es ir a nube.couchbase.comHay un periodo de prueba de 30 días, sin necesidad de tarjeta de crédito.

A partir de ahí puedes seguir los pasos y configurar tu nuevo cluster. Configura un bucket, scope, collection e index, un usuario y asegúrate de que tu cluster está disponible desde el exterior y podrás pasar a la siguiente parte. Conseguir una conexión a Couchbase desde la app. Se puede hacer con estas dos funciones. Puedes ver que están anotadas con @st.cache_resource. Se utiliza para almacenar en caché el objeto desde la perspectiva de Streamlit. Lo hace disponible para otras instancias o repeticiones. Aquí está el extracto del documento

Decorador para almacenar en caché funciones que devuelven recursos globales (por ejemplo, conexiones a bases de datos, modelos ML).

Los objetos almacenados en caché se comparten entre todos los usuarios, sesiones y repeticiones. Deben ser seguros porque se puede acceder a ellos desde varios subprocesos simultáneamente. Si la seguridad de los subprocesos es un problema, considere el uso de st.session_state para almacenar recursos por sesión.

from langchain_community.vectorstores import CouchbaseVectorStore
from langchain_openai import OpenAIEmbeddings

@st.cache_resource(show_spinner="Connecting to Vector Store")
def get_vector_store(
    _cluster,
    db_bucket,
    db_scope,
    db_collection,
    _embedding,
    index_name,
):
    """Return the Couchbase vector store"""
    vector_store = CouchbaseVectorStore(
        cluster=_cluster,
        bucket_name=db_bucket,
        scope_name=db_scope,
        collection_name=db_collection,
        embedding=_embedding,
        index_name=index_name,
        text_key
    )
    return vector_store

@st.cache_resource(show_spinner="Connecting to Couchbase")
def connect_to_couchbase(connection_string, db_username, db_password):
    """Connect to couchbase"""
    from couchbase.cluster import Cluster
    from couchbase.auth import PasswordAuthenticator
    from couchbase.options import ClusterOptions
    from datetime import timedelta
    auth = PasswordAuthenticator(db_username, db_password)
    options = ClusterOptions(auth)
    connect_string = connection_string
    cluster = Cluster(connect_string, options)
    # Wait until the cluster is ready for use.
    cluster.wait_until_ready(timedelta(seconds=5))
    return cluster

de langchain_community.vectorstores importar CouchbaseVectorStore

de langchain_openai importar OpenAIEmbeddings

@st.recurso_cache(show_spinner="Conectarse a Vector Store")

def get_vector_store(

_cluster,

db_bucket,

db_scope,

db_collection,

_embedding,

nombre_índice,

"""Devolver el almacén vectorial Couchbase"""

vector_store = CouchbaseVectorStore(

grupo=_cluster,

nombre_cubo=db_bucket,

nombre_ámbito=db_scope,

nombre_colección=db_collection,

incrustación=_embedding,

nombre_índice=nombre_índice,

texto_clave

)

devolver vector_tienda

@st.recurso_cache(show_spinner="Conexión a Couchbase")

def connect_to_couchbase(cadena_de_conexión, db_username, db_contraseña):

"""Conectarse a couchbase""""

de couchbase.grupo importar Grupo

de couchbase.auth importar PasswordAuthenticator

de couchbase.opciones importar ClusterOptions

de datetime importar timedelta

auth = PasswordAuthenticator(db_username, db_contraseña)

opciones = ClusterOptions(auth)

conectar_cadena = cadena_de_conexión

grupo = Grupo(conectar_cadena, opciones)

# Espere hasta que el clúster esté listo para su uso.

grupo.wait_until_ready(timedelta(segundos=5))

devolver grupo

Así que con esto tenemos una conexión al clúster Couchbase y una conexión a la envoltura del almacén vectorial LangChain Couchbase.

connect_to_couchbase(connection_string, db_username, db_password) crea la conexión al cluster Couchbase. get_vector_store(_cluster, db_bucket, db_scope, db_collection, _embedding, index_name,) crea el CouchabseVectorStore wrapper. Contiene una conexión al clúster, la información del bucket/ámbito/colección para almacenar los datos, el nombre del índice para asegurarnos de que podemos consultar los vectores, y una propiedad de incrustación.

Aquí se refiere a la función OpenAIEmbeddings. Recogerá automáticamente el OPENAI_API_KEY y permitir a LangChain utilizar la API de OpenAI con la clave. Cada llamada a la API será transparente para LangChain. Lo que también significa que cambiar de proveedor de modelos debería ser bastante transparente a la hora de gestionar la incrustación.

Escribir documentos LangChain en Couchbase

Ahora, donde ocurre la magia, donde obtenemos los tweets, los parseamos como JSON, creamos la incrustación y escribimos el documento JSON en la colección específica de Couchbase. Gracias a Steamlit podemos configurar un widget de subida de archivos y ejecutar una función asociada:

import tempfile
import os
from langchain.docstore.document import Document

def save_tweet_to_vector_store(uploaded_file, vector_store):
    if uploaded_file is not None:
       data = json.load(uploaded_file)  # Parse the uploaded file in JSON, expecting an array of objects

    docs = []
    ids = []
    for tweet in data: # For all JSON tweets    
        text = tweet['text']
        full_text = tweet['full_text']
        id = tweet['id']
        # Create the Langchain Document, with a text field and associated metadata.
        if full_text is not None:
            doc = Document(page_content=full_text, metadata=tweet)
        else:
            doc = Document(page_content=text, metadata=tweet)
        docs.append(doc)
        ids.append(id) # Create a similar array for Couchbase doc IDs, if not provided, uuid will be automatically generated

    vector_store.add_documents(documents = docs, ids =  ids) # Store all documents and embeddings
    st.info(f"tweet and replies loaded into vector store in {len(docs)} documents")

importar archivo temporal

importar os

de langchain.docstore.documento importar Documento

def save_tweet_to_vector_store(archivo_cargado, vector_store):

si archivo_cargado es no Ninguno:

datos = json.carga(archivo_cargado) # Analiza el archivo cargado en JSON, esperando un array de objetos

docs = []

ids = []

para tuitee en datos: # Para todos los tweets JSON

texto = tuitee[texto]

texto_completo = tuitee[texto_completo]

id = tuitee[id]

# Crear el Documento Langchain, con un campo de texto y metadatos asociados.

si texto_completo es no Ninguno:

doc = Documento(contenido_página=texto_completo, metadatos=tuitee)

si no:

doc = Documento(contenido_página=texto, metadatos=tuitee)

docs.añadir(doc)

ids.añadir(id) # Crear una matriz similar para Couchbase doc IDs, si no se proporciona, uuid se generará automáticamente

vector_store.añadir_documentos(documentos = docs, ids = ids) # Almacenar todos los documentos e incrustaciones

st.información(f"tweet y respuestas cargados en almacén vectorial en {len(docs)} documentos")

Parece algo similar al código de la parte 1, excepto que toda la creación de la incrustación es gestionada de forma transparente por LangChain. El campo de texto será vectorizado, los metadatos serán añadidos al doc de Couchbase. Se verá así:

{
"text": "@kelseyhightower SOCKS! I will throw millions of dollars at the first company to offer me socks!\n\nImportant to note here: I don’t have millions of dollars! \n\nI think I might have a problem.",
"embedding": [
    -0.0006439118069540552,
    -0.021693240183757154,
    0.026031888593037636,
    -0.020210755239867904,
    -0.003226784468532888,
    .......
    -0.01691936794757287
],
"metadata": {
    "created_at": "Thu Apr 04 16:15:02 +0000 2024",
    "id": "1775920020377502191",
    "full_text": null,
    "text": "@kelseyhightower SOCKS! I will throw millions of dollars at the first company to offer me socks!\n\nImportant to note here: I don’t have millions of dollars! \n\nI think I might have a problem.",
    "lang": "en",
    "in_reply_to": "1775913633064894669",
    "quote_count": 1,
    "reply_count": 3,
    "favorite_count": 23,
    "view_count": "4658",
    "hashtags": [],
    "user": {
    "id": "4324751",
    "name": "Josh Long",
    "screen_name ": "starbuxman",
    "url ": "https://t.co/PrSomoWx53"
    }
}

{

"texto": "@kelseyhightower ¡CALCETINES! Tiraré millones de dólares a la primera empresa que me ofrezca calcetines: ¡No tengo millones de dólares! \Creo que tengo un problema".,

"incrustación": [

-0.0006439118069540552,

-0.021693240183757154,

0.026031888593037636,

-0.020210755239867904,

-0.003226784468532888,

.......

-0.01691936794757287

"metadatos": {

"fecha_creada": "Thu Apr 04 16:15:02 +0000 2024",

"id": "1775920020377502191",

"texto_completo": null,

"texto": "@kelseyhightower ¡CALCETINES! Tiraré millones de dólares a la primera empresa que me ofrezca calcetines: ¡No tengo millones de dólares! \Creo que tengo un problema".,

"lang": "es",

"in_reply_to": "1775913633064894669",

"quote_count": 1,

"reply_count": 3,

"cuenta_favoritos": 23,

"view_count": "4658",

"hashtags": [],

"usuario": {

"id": "4324751",

"nombre": "Josh Long",

"nombre_de_pantalla": "starbuxman",

" url ": "https://t.co/PrSomoWx53"

}

A partir de ahora tenemos funciones para gestionar la subida de tweets, vectorizar los tweets y almacenarlos en Couchbase. Es hora de utilizar Streamlit para construir la aplicación real y gestionar el flujo de chat. Vamos a dividir esa función en varios trozos.

Escribir una aplicación Streamlit

Empezando por la declaración principal y la protección de la app. No quieres que nadie la use, y usar tus créditos OpenAI. Gracias a Streamlit se puede hacer con bastante facilidad. Aquí configuramos una protección por contraseña usando el LOGIN_PASSWORD env. Y también configuramos la página global gracias a la variable set_page_config método. Esto le dará un simple formulario para introducir la contraseña, y una simple página.

if name == "__main__":
    # Authorization
    if "auth" not in st.session_state:
        st.session_state.auth = False
    st.set_page_config(
        page_title="Chat with a tweet export using Langchain, Couchbase & OpenAI",
        page_icon="🤖",
        layout="centered",
        initial_sidebar_state="auto",
        menu_items=None,
    )
    AUTH = os.getenv("LOGIN_PASSWORD")
    check_environment_variable("LOGIN_PASSWORD")
    # Authentication
    user_pwd = st.text_input("Enter password", type="password")
    pwd_submit = st.button("Submit")
    if pwd_submit and user_pwd == AUTH:
        st.session_state.auth = True
    elif pwd_submit and user_pwd != AUTH:
        st.error("Incorrect password")

si nombre == "__main__":

# Autorización

si "auth" no en st.estado_sesión:

st.estado_sesión.auth = Falso

st.set_page_config(

título_página="Chatea con una exportación de tuits usando Langchain, Couchbase y OpenAI",

page_icon="🤖",

diseño="centrado",

initial_sidebar_state="auto",

elementos_menú=Ninguno,

)

AUTH = os.getenv("LOGIN_PASSWORD")

comprobar_variable_entorno("LOGIN_PASSWORD")

Autenticación #

usuario_pwd = st.entrada_texto("Introducir contraseña", tipo="contraseña")

pwd_submit = st.botón("Enviar")

si pwd_submit y usuario_pwd == AUTH:

st.estado_sesión.auth = Verdadero

elif pwd_submit y usuario_pwd != AUTH:

st.error("Contraseña incorrecta")

Para ir un poco más allá podemos añadir las comprobaciones de variables de entorno, la configuración de OpenAI y Couchbase, y un simple título para iniciar el flujo de la app.

if st.session_state.auth:
    # Load environment variables
    DB_CONN_STR = os.getenv("DB_CONN_STR")
    DB_USERNAME = os.getenv("DB_USERNAME")
    DB_PASSWORD = os.getenv("DB_PASSWORD")
    DB_BUCKET = os.getenv("DB_BUCKET")
    DB_SCOPE = os.getenv("DB_SCOPE")
    DB_COLLECTION = os.getenv("DB_COLLECTION")
    INDEX_NAME = os.getenv("INDEX_NAME")

# Ensure that all environment variables are set
check_environment_variable("OPENAI_API_KEY")
check_environment_variable("DB_CONN_STR")
check_environment_variable("DB_USERNAME")
check_environment_variable("DB_PASSWORD")
check_environment_variable("DB_BUCKET")
check_environment_variable("DB_SCOPE")
check_environment_variable("DB_COLLECTION")
check_environment_variable("INDEX_NAME")
# Use OpenAI Embeddings
embedding = OpenAIEmbeddings()
# Connect to Couchbase Vector Store
cluster = connect_to_couchbase(DB_CONN_STR, DB_USERNAME, DB_PASSWORD)
vector_store = get_vector_store(
    cluster,
    DB_BUCKET,
    DB_SCOPE,
    DB_COLLECTION,
    embedding,
    INDEX_NAME,
)
st.title("Chat with X")

si st.estado_sesión.auth:

# Cargar variables de entorno

DB_CONN_STR = os.getenv("DB_CONN_STR")

NOMBRE DE USUARIO DE BASE DE DATOS = os.getenv("DB_USERNAME)

DB_PASSWORD = os.getenv("DB_PASSWORD")

DB_BUCKET = os.getenv("DB_BUCKET")

DB_SCOPE = os.getenv("DB_SCOPE")

DB_COLECCIÓN = os.getenv("DB_COLLECTION")

NOMBRE_DEL_ÍNDICE = os.getenv("INDEX_NAME")

# Asegúrese de que todas las variables de entorno están configuradas

comprobar_variable_entorno("OPENAI_API_KEY")

comprobar_variable_entorno("DB_CONN_STR")

comprobar_variable_entorno("DB_USERNAME)

comprobar_variable_entorno("DB_PASSWORD")

comprobar_variable_entorno("DB_BUCKET")

comprobar_variable_entorno("DB_SCOPE")

comprobar_variable_entorno("DB_COLLECTION")

comprobar_variable_entorno("INDEX_NAME")

# Utilizar OpenAI Embeddings

incrustación = OpenAIEmbeddings()

# Conectarse al almacén vectorial Couchbase

grupo = connect_to_couchbase(DB_CONN_STR, NOMBRE DE USUARIO DE BASE DE DATOS, DB_PASSWORD)

vector_store = get_vector_store(

grupo,

DB_BUCKET,

DB_SCOPE,

DB_COLECCIÓN,

incrustación,

NOMBRE_DEL_ÍNDICE,

)

st.título("Chatear con X")

Streamlit tiene una buena integración de espacio de código, realmente te animo a usarlo, hace que el desarrollo sea realmente fácil. Y nuestro plugin VSCode puede ser instalado, para que puedas navegar por Couchbase y ejecutar consultas.

Run SQ++ Vector Search query from Codespace

Ejecutar consulta de búsqueda vectorial SQL++ desde el espacio de código

A Basic streamlit application opened in codespace

Una aplicación Basic Streamlit abierta en Codespace

Crear cadenas LangChain

Después viene la configuración de la cadena. Aquí es donde LangChain brilla. Aquí es donde podemos configurar la retriever. Va a ser utilizado por LangChain para consultar Couchbase para todos los tweets vectorizados. Entonces es el momento de construir el prompt RAG. Puedes ver que la plantilla toma un {contexto} y {pregunta} parámetro. Creamos un objeto Chat prompt a partir de la plantilla.

Después viene la elección del LLM, aquí elegí GPT4. Y por último la creación de la cadena.

# Use couchbase vector store as a retriever for RAG
retriever = vector_store.as_retriever()
# Build the prompt for the RAG
template = """You are a helpful bot. If you cannot answer based on the context provided, respond with a generic answer. Answer the question as truthfully as possible using the context below:
{context}
Question: {question}"""
prompt = ChatPromptTemplate.from_template(template)
# Use OpenAI GPT 4 as the LLM for the RAG
llm = ChatOpenAI(temperature=0, model="gpt-4-1106-preview", streaming=True)
# RAG chain
chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# Utilizar el almacén de vectores couchbase como recuperador para RAG

retriever = vector_store.as_retriever()

# Construye el prompt para el RAG

plantilla = """Eres un bot de ayuda. Si no puedes responder basándote en el contexto proporcionado, responde con una respuesta genérica. Responde a la pregunta con la mayor sinceridad posible utilizando el contexto que se indica a continuación:

{contexto}

Pregunta: {pregunta}"""

consulte = ChatPromptTemplate.desde_plantilla(plantilla)

# Utilizar OpenAI GPT 4 como LLM para el GAR

llm = ChatOpenAI(temperatura=0, modelo="gpt-4-1106-preview", streaming=Verdadero)

# Cadena RAG

cadena = (

{"contexto": retriever, "pregunta": RunnablePassthrough()}

| consulte

| llm

| StrOutputParser()

)

La cadena se construye a partir del modelo elegido, el contexto y los parámetros de consulta, el objeto prompt y un objeto StrOuptutParser. Su función es analizar la respuesta LLM y enviarla de vuelta como una cadena streamable/chunkable. La dirección RunnablePassthrough llamado para el parámetro de la pregunta se utiliza para asegurarse de que se pasa al prompt 'tal cual' pero puedes utilizar otros métodos para cambiar/sanitizar la pregunta. Eso es todo, una arquitectura RAG. Dando un contexto adicional a una pregunta LLM para obtener una mejor respuesta.

También podemos construir una cadena sin él para comparar los resultados:

# Pure OpenAI output without RAG
template_without_rag = """You are a helpful bot. Answer the question as truthfully as possible.
Question: {question}"""
prompt_without_rag = ChatPromptTemplate.from_template(template_without_rag)
llm_without_rag = ChatOpenAI(model="gpt-4-1106-preview")
chain_without_rag = (
    {"question": RunnablePassthrough()}
    | prompt_without_rag
    | llm_without_rag
    | StrOutputParser()
)

# Salida OpenAI pura sin RAG

plantilla_sin_arrastre = """Eres un bot muy útil. Responde a la pregunta con la mayor sinceridad posible.

Pregunta: {pregunta}"""

prompt_without_rag = ChatPromptTemplate.desde_plantilla(plantilla_sin_arrastre)

llm_without_rag = ChatOpenAI(modelo="gpt-4-1106-preview")

cadena_sin_arrastre = (

{"pregunta": RunnablePassthrough()}

| prompt_without_rag

| llm_without_rag

| StrOutputParser()

)

No hay necesidad de contexto en la plantilla de consulta y el parámetro de cadena, y no hay necesidad de un recuperador.

Ahora que tenemos un par de cadenas, podemos utilizarlas a través de Streamlit. Este código añadirá la primera pregunta y la barra lateral, permitiendo carga de archivos:

# Frontend
couchbase_logo = (
    "https://emoji.slack-edge.com/T024FJS4M/couchbase/4a361e948b15ed91.png"
)
st.markdown(
    "Answers with [Couchbase logo](https://emoji.slack-edge.com/T024FJS4M/couchbase/4a361e948b15ed91.png) are generated using RAG while 🤖 are generated by pure LLM (ChatGPT)"
)

with st.sidebar:
    st.header("Upload your X")
    with st.form("upload X"):
        uploaded_file = st.file_uploader(
            "Choose a X export.",
            help="The document will be deleted after one hour of inactivity (TTL).",
            type="json",
        )
    submitted = st.form_submit_button("Upload")
    if submitted:    
        # store the tweets in the vector store
        save_tweet_to_vector_store(uploaded_file, vector_store)

    st.subheader("How does it work?")
    st.markdown(
    """
    For each question, you will get two answers:
    * one using RAG ([Couchbase logo](https://emoji.slack-edge.com/T024FJS4M/couchbase/4a361e948b15ed91.png))
    * one using pure LLM - OpenAI (🤖).
    """
    )
    st.markdown(
    "For RAG, we are using [Langchain](https://langchain.com/), [Couchbase Vector Search](https://couchbase.com/) & [OpenAI](https://openai.com/). We fetch tweets relevant to the question using Vector search & add it as the context to the LLM. The LLM is instructed to answer based on the context from the Vector Store."
    )
    # View Code
    if st.checkbox("View Code"):
        st.write(
        "View the code here: [Github](https://github.com/couchbase-examples/rag-demo/blob/main/chat_with_x.py)"
        )

# Frontend

couchbase_logo = (

"https://emoji.slack-edge.com/T024FJS4M/couchbase/4a361e948b15ed91.png"

)

st.rebajas(

"Las respuestas con [logo de Couchbase](https://emoji.slack-edge.com/T024FJS4M/couchbase/4a361e948b15ed91.png) se generan usando RAG mientras que 🤖 se generan mediante LLM puro (ChatGPT)"

)

con st.barra lateral:

st.cabecera("Sube tu X")

con st.formulario("subir X"):

archivo_cargado = st.cargador_archivos(

"Elige una exportación X".,

ayuda="El documento se eliminará tras una hora de inactividad (TTL)".,

tipo="json",

)

enviado = st.botón_enviar_formulario("Subir")

si enviado:

# almacenar los tweets en el almacén de vectores

save_tweet_to_vector_store(archivo_cargado, vector_store)

st.subtítulo("¿Cómo funciona?")

st.rebajas(

"""

Para cada pregunta, obtendrá dos respuestas:

* uno usando RAG ([Couchbase logo](https://emoji.slack-edge.com/T024FJS4M/couchbase/4a361e948b15ed91.png))

* uno que utiliza LLM puro - OpenAI (🤖).

"""

)

st.rebajas(

"Para RAG, utilizamos [Langchain](https://langchain.com/), [Couchbase Vector Search](https://couchbase.com/) y [OpenAI](https://openai.com/). Obtenemos tweets relevantes para la pregunta utilizando la búsqueda vectorial y los añadimos como contexto al LLM. El LLM recibe instrucciones para responder basándose en el contexto del almacén vectorial".

)

# Ver Código

si st.casilla("Ver Código"):

st.escriba a(

"Ver el código aquí: [Github](https://github.com/couchbase-examples/rag-demo/blob/main/chat_with_x.py)"

)

A continuación, las instrucciones y la lógica de entrada:

# Look at the message history and append the first message if empty
if "messages" not in st.session_state:
    st.session_state.messages = []
    st.session_state.messages.append(
        {
            "role": "assistant",
            "content": "Hi, I'm a chatbot who can chat with the tweets. How can I help you?",
            "avatar": "🤖",
        }
    )

# Display chat messages from history on app rerun
for message in st.session_state.messages:
    with st.chat_message(message["role"], avatar=message["avatar"]):
        st.markdown(message["content"])

# React to user input
if question := st.chat_input("Ask a question based on the Tweets"):
    # Display user message in chat message container
    st.chat_message("user").markdown(question)

    # Add user message to chat history
    st.session_state.messages.append(
        {"role": "user", "content": question, "avatar": "👤"}
    )

    # Add placeholder for streaming the response
    with st.chat_message("assistant", avatar=couchbase_logo):
        message_placeholder = st.empty()

    # stream the response from the RAG
    rag_response = ""
    for chunk in chain.stream(question):
        rag_response += chunk
        message_placeholder.markdown(rag_response + "▌")

    message_placeholder.markdown(rag_response)
    st.session_state.messages.append(
        {
            "role": "assistant",
            "content": rag_response,
            "avatar": couchbase_logo,
        }
    )

    # stream the response from the pure LLM

    # Add placeholder for streaming the response
    with st.chat_message("ai", avatar="🤖"):
        message_placeholder_pure_llm = st.empty()

    pure_llm_response = ""

    for chunk in chain_without_rag.stream(question):
        pure_llm_response += chunk
        message_placeholder_pure_llm.markdown(pure_llm_response + "▌")

    message_placeholder_pure_llm.markdown(pure_llm_response)
    st.session_state.messages.append(
        {
            "role": "assistant",
            "content": pure_llm_response,
            "avatar": "🤖",
        }
    )

# Mira el historial de mensajes y añade el primer mensaje si está vacío

si "mensajes" no en st.estado_sesión:

st.estado_sesión.mensajes = []

st.estado_sesión.mensajes.añadir(

{

"rol": "asistente",

"contenido": "Hola, soy un chatbot que puede chatear con los tuiteros. ¿En qué puedo ayudarte?",

"avatar": "🤖",

}

)

# Mostrar mensajes de chat del historial al reiniciar la aplicación

para mensaje en st.estado_sesión.mensajes:

con st.mensaje_de_chat(mensaje["rol"], avatar=mensaje["avatar"]):

st.rebajas(mensaje["contenido"])

# Reaccionar a las entradas del usuario

si pregunta := st.chat_input("Haz una pregunta basada en los Tweets"):

# Mostrar mensaje de usuario en el contenedor de mensajes de chat

st.mensaje_de_chat("usuario").rebajas(pregunta)

# Añadir mensaje de usuario al historial de chat

st.estado_sesión.mensajes.añadir(

{"rol": "usuario", "contenido": pregunta, "avatar": "👤"}

)

# Añadir marcador de posición para la transmisión de la respuesta

con st.mensaje_de_chat("asistente", avatar=couchbase_logo):

marcador_plaza_mensaje = st.vacío()

# transmitir la respuesta del GAR

trapo_respuesta = ""

para trozo en cadena.flujo(pregunta):

trapo_respuesta += trozo

marcador_plaza_mensaje.rebajas(trapo_respuesta + "▌")

marcador_plaza_mensaje.rebajas(trapo_respuesta)

st.estado_sesión.mensajes.añadir(

{

"rol": "asistente",

"contenido": trapo_respuesta,

"avatar": couchbase_logo,

}

)

# stream la respuesta del LLM puro

# Añadir marcador de posición para la transmisión de la respuesta

con st.mensaje_de_chat("ai", avatar="🤖"):

marcador_plaza_mensaje_puro_llm = st.vacío()

pure_llm_response = ""

para trozo en cadena_sin_arrastre.flujo(pregunta):

pure_llm_response += trozo

marcador_plaza_mensaje_puro_llm.rebajas(pure_llm_response + "▌")

marcador_plaza_mensaje_puro_llm.rebajas(pure_llm_response)

st.estado_sesión.mensajes.añadir(

{

"rol": "asistente",

"contenido": pure_llm_response,

"avatar": "🤖",

}

)

Con eso tienes todo lo necesario para ejecutar la aplicación streamlit que permite al usuario:

- Cargar un archivo JSON que contenga tweets
- Transformar cada tweet en un documento LangChain
- Almacenarlos en Couchbase junto con su representación de incrustación
- Gestiona dos avisos diferentes:
  - uno con un recuperador LangChain para añadir contexto
  - y uno sin

Si ejecutas la aplicación deberías ver algo como esto:

The full streamlit application example opened in Codespace

El ejemplo completo de aplicación streamlit abierto en Codespace

Conclusión

Y cuando se pregunta "¿son importantes los calcetines para los desarrolladores?", se obtienen dos respuestas muy interesantes:

Basándonos en el contexto proporcionado, parece que los calcetines son importantes para algunos desarrolladores, como mencionan Josh Long y Simon Willison en sus tuits. Expresan su deseo de tener calcetines y parecen valorarlos.

Los calcetines son importantes para los desarrolladores, ya que proporcionan comodidad y apoyo mientras pasan largas horas sentados frente al ordenador. Además, mantener los pies calientes puede ayudar a mejorar la concentración y la productividad.

Voilà, tenemos un bot que sabe de un hilo de twitter, y puede responder en consecuencia. Y lo más divertido es que no sólo utilizó el vector de texto en el contexto, sino también todos los metadatos almacenados, como el nombre de usuario, porque también indexamos todos los metadatos del documento LangChain al crear el índice en la parte 1.

¿Pero esto es realmente resumir el hilo X? Pues no. Porque la búsqueda vectorial enriquecerá el contexto con los documentos más cercanos y no con el hilo completo. Así que hay que hacer un poco de ingeniería de datos. Hablaremos de ello en la próxima parte.

Recursos

- Obtener el Ejemplo de código de demostración RAG para seguir
- Inscríbete en prueba gratuita de Couchbase Capella DBaaS para probarlo usted mismo

Laurent Doguin

Comparte este artículo

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

Twitter Thread tl;dr ¿Con IA? Parte 2

LangChain y Streamlit

Configuración

Escribir documentos LangChain en Couchbase

Escribir una aplicación Streamlit

Crear cadenas LangChain

Conclusión

Recursos

Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada

Autor

Publicado por Laurent Doguin

Deja un comentario Cancelar respuesta

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Utilizar Capella gratis

Póngase en contacto