Couchbase Móvil

Mejora de la privacidad y el rendimiento de GenAI: El futuro de la IA personalizada con bases de datos vectoriales de aristas

La evolución de la IA Generativa (GenAI) está marcada por una importante transición del desarrollo de modelos al desarrollo de aplicaciones. A medida que estos modelos de IA maduran, la atención pasa a centrarse en su integración en aplicaciones del mundo real, lo que plantea nuevos retos. Los desarrolladores de aplicaciones y los proveedores de infraestructuras como los proveedores de servicios en la nube (CSP), incluidos los fabricantes de móviles, están a la vanguardia de esta transición, enfrentándose a decisiones críticas que determinarán el éxito de sus iniciativas de IA.

Entre los principales retos figuran:

    1. Mejor en su clase vs. Tiempo de comercialización: Tradicionalmente, el desarrollo de aplicaciones se ha basado en la integración de las mejores tecnologías de su clase en una pila tecnológica completa. Sin embargo, la aparición de plataformas de nueva generación ha asumido los retos de ingeniería que supone integrar múltiples servicios en una única plataforma, acelerando así el tiempo de comercialización.
    2. Computación centralizada frente a Edge Compute: Decidir entre un procesamiento centralizado potente y robusto frente a las ventajas de baja latencia y mejora de la privacidad de la computación periférica.
    3. Producción con incógnitas: Aunque hoy en día existe una experiencia considerable en validación de producción y controles de conformidad con aplicaciones adaptativas, nos estamos aventurando en una nueva frontera. Hay muy poca experiencia pasada en la que basarse para garantizar el éxito.

Este artículo se centra en la Computación centralizada frente a Edge Compute explorando por qué una base de datos de la nube al borde con capacidad vectorial abordará mejor los retos de la privacidad de los datos, el rendimiento y la rentabilidad.

Centralizado vs. Edge

Informática centralizada

En una arquitectura informática centralizada, el cálculo principal y el almacenamiento de datos se producen en la nube. El flujo de trabajo es el siguiente:

    1. Solicitud de incrustación: El dispositivo de borde (por ejemplo, un smartphone) envía una solicitud a un modelo de IA basado en la nube para la generación de incrustaciones.
    2. Vector de incrustación: El modelo de IA en la nube procesa la solicitud y devuelve el vector de incrustación al dispositivo de borde.
    3. Almacenamiento vectorial: El vector de incrustación se almacena en una base de datos de vectores centralizada en la nube.
    4. Consulta de búsqueda: El dispositivo de borde envía una consulta de búsqueda a la base de datos vectorial de la nube.
    5. Resultado de la búsqueda: La base de datos vectorial en la nube procesa la consulta y devuelve los resultados de la búsqueda al dispositivo de borde para su visualización.

Este enfoque depende en gran medida de la conectividad constante a Internet para el intercambio de datos entre el dispositivo periférico y la nube. Aunque aprovecha la gran capacidad de cálculo de los servidores en la nube, introduce latencia y posibles problemas de privacidad de los datos debido a la transmisión de información sensible a través de internet.

Computación de borde

En una arquitectura de computación de borde, el cálculo y el almacenamiento de datos se producen localmente en el dispositivo de borde. El flujo de trabajo es el siguiente:

    1. Solicitud de incrustación: El dispositivo de borde envía una solicitud a un modelo de IA incrustado para la generación de incrustaciones.
    2. Vector de incrustación: El modelo de IA incrustada procesa la solicitud y genera el vector de incrustación localmente en el dispositivo.
    3. Almacenamiento vectorial: El vector de incrustación se almacena en una base de datos local de vectores de bordes en el dispositivo.
    4. Consulta de búsqueda: El dispositivo de borde envía una consulta de búsqueda a la base de datos local de vectores de borde.
    5. Resultado de la búsqueda: La base de datos vectorial de bordes procesa la consulta y devuelve los resultados de la búsqueda localmente para su visualización en el dispositivo.

Este enfoque elimina la necesidad de una conectividad constante a Internet, reduciendo la latencia y mejorando la privacidad de los datos al mantener la información sensible en el dispositivo. Sin embargo, requiere recursos informáticos suficientes en el dispositivo periférico para gestionar el procesamiento y almacenamiento de la IA.Al comparar estas dos arquitecturas, podemos ver que la computación periférica ofrece ventajas significativas en términos de latencia reducida y privacidad de datos mejorada, lo que la convierte en una opción convincente para aplicaciones que requieren procesamiento en tiempo real y estrictos controles de privacidad.

Alto rendimiento y rentabilidad siempre activos

Cuando se pone en producción una aplicación adaptativa impulsada por GenAI, la gestión de miles de millones de interacciones con el modelo de IA cada segundo supone un reto importante. El ancho de banda, la infraestructura y los recursos informáticos necesarios para soportar operaciones tan extensas son considerables, lo que conlleva elevados costes operativos. Los sistemas centralizados tradicionales pueden tener dificultades para hacer frente a estas demandas, lo que se traduce en posibles problemas de latencia y en un aumento de los gastos. Una plataforma de base de datos de la nube al perímetro con capacidades vectoriales aborda estos retos permitiendo el procesamiento local de datos en dispositivos periféricos, garantizando un acceso a los datos de baja latencia al almacenar y procesar la información cerca del usuario. Esto es crucial para las aplicaciones GenAI en tiempo real, como los asistentes virtuales interactivos y las recomendaciones de contenidos personalizadas, que requieren una recuperación y un procesamiento de datos instantáneos.

Las aplicaciones móviles que utilizan una plataforma de base de datos de la nube al borde pueden funcionar sin problemas incluso en escenarios sin conexión, garantizando un servicio ininterrumpido y la disponibilidad de los datos, esencial para aplicaciones en entornos remotos o con problemas de conectividad. La capacidad de ejecutar grandes modelos lingüísticos (LLM) sin conexión en el dispositivo es una ventaja significativa, ya que permite realizar operaciones complejas de IA sin depender de una conectividad continua. Además, estas plataformas ofrecen sólidas capacidades de sincronización con bases de datos centrales, lo que garantiza que los dispositivos periféricos estén siempre sincronizados. Este enfoque híbrido combina lo mejor del procesamiento local con la integración en la nube, manteniendo un alto rendimiento y la coherencia de los datos en todos los sistemas distribuidos.

Al procesar los datos localmente, una plataforma de base de datos de la nube al borde reduce significativamente la cantidad de datos transmitidos hacia y desde la nube, disminuyendo los costes de ancho de banda y mejorando la capacidad de respuesta de la aplicación al minimizar la dependencia de la red. Estas plataformas facilitan la escalabilidad de las aplicaciones GenAI distribuyendo las cargas de procesamiento de datos entre múltiples dispositivos periféricos, aliviando la presión sobre los servidores centrales y permitiendo una gestión eficiente de las crecientes demandas de los usuarios sin necesidad de grandes inversiones en infraestructuras en la nube. Además, la computación de borde es intrínsecamente más eficiente desde el punto de vista energético, ya que reduce la necesidad de transferir datos continuamente a centros de datos centralizados, lo que se traduce en un ahorro de costes y contribuye a prácticas informáticas sostenibles al reducir el consumo total de energía de las aplicaciones GenAI.

Mejorar la privacidad de los datos

El entusiasmo inicial en torno a las aplicaciones GenAI a menudo pasa por alto el aspecto crítico de la privacidad personal. A medida que los usuarios son más conscientes de los problemas relacionados con la privacidad de los datos, su disposición a sacrificar la privacidad por la comodidad que ofrece la IA disminuye. Sin embargo, es posible alcanzar un equilibrio en el que coexistan la privacidad y las capacidades avanzadas de la IA.

Una plataforma de base de datos de la nube al borde con capacidades vectoriales aprovecha la computación de borde para almacenar y procesar datos localmente en el dispositivo, minimizando la necesidad de transferir información sensible a través de Internet. Este enfoque local garantiza que los datos confidenciales permanezcan en el dispositivo y solo se sincronicen con la nube cuando sea necesario. Al procesar los datos en los dispositivos periféricos, la plataforma reduce el volumen de datos transmitidos a los servidores centrales, disminuyendo así la exposición a posibles ciberataques. Esta estrategia mejora la seguridad al limitar los datos al dispositivo del usuario a menos que sea necesario sincronizarlos con una base de datos en la nube. Además, la computación de borde otorga a los usuarios un mayor control sobre sus datos, permitiéndoles gestionar los permisos y los niveles de acceso de forma más eficaz.

Procesar los datos localmente también significa que las interacciones del usuario y la información personal se gestionan dentro de los límites del dispositivo del usuario, adhiriéndose a normativas de protección de datos como GDPR y CCPA. Este enfoque reduce significativamente el riesgo de violación de datos y de acceso no autorizado, fomentando una mayor confianza entre los usuarios. Al mantener la privacidad y la seguridad de los datos, una plataforma de base de datos de la nube al borde no solo cumple los requisitos normativos, sino que también se alinea con la creciente demanda de soluciones de IA conscientes de la privacidad.

Aunque todos los fabricantes de móviles están integrando sus modelos lingüísticos grandes (LLM) o pequeños (SLM) en los dispositivos móviles, también es esencial considerar una sólida plataforma de datos de la nube al borde que proporcione capacidad vectorial. En el caso de los LLM o SLM, los fabricantes de móviles tienen varias opciones, como OpenAI, Google Gemini Nano y varios modelos de código abierto. Sin embargo, las bases de datos de nube a borde que proporcionan capacidades vectoriales tienen opciones muy limitadas. Couchbase Lite y Couchbase Server son los únicos productos comerciales que ofrecen esta capacidad. Como alternativa, los fabricantes de móviles tendrían que implementar sus propias soluciones para lograr una funcionalidad similar.

Ejemplo práctico: Transformación del marketing digital con Edge AI y bases de datos vectoriales

La implementación de GenAI y bases de datos vectoriales en el borde tiene el potencial de remodelar todo el panorama del marketing digital. Hoy en día, el marketing digital se basa en gran medida en la recopilación de datos personales, demográficos y patrones de comportamiento de forma centralizada para predecir la "mejor oferta" o el "anuncio más eficaz." Este enfoque centralizado presenta retos obvios en relación con la privacidad de los datos, ya que los individuos a menudo no tienen más remedio que compartir su información personal.

Con GenAI y las bases de datos vectoriales operando en el borde, los dispositivos personales pueden analizar continuamente el comportamiento individual y almacenar todos estos datos como incrustaciones localmente. Este enfoque descentralizado cambia radicalmente la forma de ofrecer contenidos personalizados al tiempo que aborda los problemas de privacidad.

Cómo funciona

    1. Análisis y almacenamiento local:
      • Los dispositivos personales (p. ej., teléfonos inteligentes, tabletas) recopilan y analizan el comportamiento del usuario en tiempo real, generando incrustaciones (mediante el aprovechamiento de LLM/SLM de borde) que encapsulan este comportamiento.
      • Estas incrustaciones se almacenan localmente en el dispositivo (aprovechando una base de datos vectorial como Couchbase Lite), lo que garantiza que los datos personales en bruto nunca abandonan el control del usuario.
    2. Solicitud y entrega de contenidos:
      • En lugar de enviar información personal a un servidor central, el dispositivo envía una solicitud de tipos específicos de contenidos o anuncios basados en las incrustaciones almacenadas localmente.
      • Cuando el servidor central recibe esta petición, proporciona un catálogo de identificadores de contenidos o anuncios relevantes sin conocer los datos concretos del usuario.
    3. Renderización de contenidos locales:
      • El dispositivo personal utiliza los identificadores de contenido para buscar y mostrar el contenido o anuncio adecuado (desde los servidores centralizados) en el momento oportuno.
      • Este proceso garantiza la entrega de contenidos personalizados sin que los servidores centrales accedan a los datos personales, manteniendo así la privacidad del usuario.

Impacto en el marketing digital

Este enfoque basado en los bordes puede mejorar significativamente la privacidad al tiempo que permite un marketing altamente personalizado. Los vendedores pueden ofrecer contenido relevante a los usuarios en función de su comportamiento y preferencias sin acceder ni almacenar datos personales de forma centralizada. Este método puede reducir el riesgo de filtración de datos y generar mayor confianza entre los consumidores, cada vez más preocupados por su privacidad.

Aplicación en consultas médicas

Las ventajas de este enfoque van más allá del marketing digital y se extienden a ámbitos como las consultas médicas. Por ejemplo, los dispositivos vestibles pueden monitorizar los parámetros de salud de los pacientes y almacenar estos datos localmente. Las recomendaciones médicas pueden entonces personalizarse y entregarse al paciente sin transmitir datos sanitarios sensibles a servidores centrales. De este modo se garantiza la privacidad del paciente al tiempo que se proporciona una atención médica personalizada de alta calidad.

Al aprovechar la IA de vanguardia y las bases de datos vectoriales, las industrias pueden transformar sus enfoques sobre la privacidad y la personalización de los datos, garantizando que los usuarios reciban experiencias a medida sin comprometer su información personal. Este cambio de paradigma no solo aborda los problemas de privacidad, sino que también abre nuevas vías para la innovación y la creación de confianza en diversos sectores.

Fabricantes de hardware (móvil)

Para los fabricantes de hardware, la adopción de una estrategia de IA de la nube a los bordes es crucial para seguir siendo competitivos y ofrecer experiencias de usuario avanzadas y personalizadas. Una arquitectura integral de varios niveles que incluya dispositivos móviles personales, servidores domésticos y capacidades de IA en la nube puede optimizar el rendimiento y la privacidad en diferentes casos de uso. Los fabricantes deben tener en cuenta la posibilidad de garantizar una integración perfecta de los modelos de IA en todos los dispositivos y plataformas en la nube, integrando las capacidades de IA directamente en los dispositivos móviles y los servidores domésticos y manteniendo al mismo tiempo una sincronización sólida con los servicios en la nube. Este enfoque permite un despliegue escalable y flexible de los modelos de IA, en el que los dispositivos personales gestionan el procesamiento en tiempo real y las interacciones inmediatas con el usuario, los servidores domésticos gestionan cálculos más complejos y los servicios en la nube proporcionan un amplio almacenamiento de datos y análisis avanzados.

Arquitectura de varios niveles

    1. Dispositivos Edge: Estos dispositivos deben tener la capacidad de ejecutar modelos de IA localmente, garantizando una baja latencia y una alta capacidad de respuesta. La incorporación de bases de datos vectoriales como Couchbase Lite puede permitir la personalización en tiempo real sin comprometer la privacidad del usuario.
    2. Nodos de borde (servidores domésticos): Los servidores domésticos pueden actuar como nodos intermedios, proporcionando potencia de cálculo y almacenamiento adicionales. Pueden gestionar tareas de IA más intensivas y mantener modelos actualizados sincronizándose con servidores en la nube.
    3. Capacidades centralizadas de IA en la nube: La capa de nube proporciona almacenamiento de datos completo, análisis avanzados y sincronización global. Garantiza que los modelos y datos de IA sean coherentes y se actualicen en todos los dispositivos, lo que permite la conservación de datos a largo plazo y el procesamiento de datos a gran escala.

Conclusión

Para los desarrolladores de aplicaciones, proveedores de infraestructura y fabricantes de móviles, aprovechar una base de datos de la nube al borde con capacidades vectoriales puede mejorar significativamente la personalización de las experiencias GenAI. Al garantizar la privacidad de los datos, el alto rendimiento y la rentabilidad, una plataforma de este tipo permite a los desarrolladores crear aplicaciones de IA con capacidad de respuesta, seguras y escalables.

A medida que crece la demanda de aplicaciones GenAI personalizadas, la adopción de una plataforma de base de datos de la nube al borde con capacidades vectoriales será crucial para ofrecer experiencias de usuario óptimas. Este enfoque aborda los desafíos críticos de manejar interacciones masivas de datos, reducir los costes operativos y mantener estrictas normas de privacidad de datos. Al procesar los datos localmente, reducir la transmisión de datos a servidores centrales y otorgar a los usuarios el control sobre sus datos, estas plataformas proporcionan un entorno seguro y privado para desplegar aplicaciones avanzadas de IA.

De cara al futuro, el camino hacia la producción de estas aplicaciones adaptativas presenta muchas incógnitas. Mientras navegamos por esta nueva frontera, será esencial adaptar y perfeccionar continuamente nuestros planteamientos basándonos en experiencias del mundo real y en las mejores prácticas emergentes. Estoy impaciente por seguir debatiendo estos detalles con todas las partes interesadas y agradeceré cualquier idea u opinión divergente. Por favor, no duden en dejarme mensajes con sus pensamientos y perspectivas. Juntos podemos explorar y superar los retos de esta apasionante evolución tecnológica.

Referencias

    1. Couchbase Lite: Base de datos móvil para aplicaciones offline
    2. Cumplimiento del GDPR en Edge Computing
    3. IBM Cloud - Por qué el Edge Computing necesita sincronización
    4. AWS - Aplicaciones Edge AI en tiempo real
    5. Ventajas de Edge Computing para aplicaciones en tiempo real
    6. ObjectBox: Base de datos Edge de alto rendimiento
    7. Couchbase Capella: Base de datos gestionada en la nube
    8. Búsqueda vectorial en Google Cloud Firestore
    9. Edge AI y su papel en los dispositivos móviles
Comparte este artículo
Recibe actualizaciones del blog de Couchbase en tu bandeja de entrada
Este campo es obligatorio.

Autor

Publicado por Genie Yuan, VP Couchbase APAC

Exjefe de Ingeniería de Campo de Couchbase APAC, Jefe de Éxito de Clientes / Servicios Profesionales de Kinetica, Director de la División Cognitiva y de IA de Deloitte, Profesor Adjunto en el programa de MBA de la Universidad Sun Yet-sen. Genie Yuan es un experimentado profesional de TI con más de dos décadas de experiencia en soluciones de IA y datos. Reconocido por su liderazgo de pensamiento técnico, Genie destaca en análisis avanzados, aprendizaje automático e inteligencia empresarial. Con una amplia experiencia como desarrollador, analista empresarial, jefe de entrega de proyectos y arquitecto jefe, Genie ha dirigido con éxito ciclos de desarrollo completos para numerosos proyectos. Aprovechando su experiencia práctica en grandes corporaciones, empresas de consultoría y proveedores, Genie impulsa constantemente la innovación y ofrece resultados impactantes, dando forma al futuro de la tecnología a través de ideas estratégicas y soluciones prácticas.

Deja un comentario

¿Listo para empezar con Couchbase Capella?

Empezar a construir

Consulte nuestro portal para desarrolladores para explorar NoSQL, buscar recursos y empezar con tutoriales.

Utilizar Capella gratis

Ponte manos a la obra con Couchbase en unos pocos clics. Capella DBaaS es la forma más fácil y rápida de empezar.

Póngase en contacto

¿Quieres saber más sobre las ofertas de Couchbase? Permítanos ayudarle.