Bem-vindo à temporada de IA. IA generativa. Neste blog, explicaremos como a IA generativa funciona com o Couchbase. Sabemos que a IA generativa será um grande problema e uma grande oportunidade para quase todos os aplicativos corporativos habilitados para dados. Neste blog, vamos nos aprofundar no que é IA generativa, como funciona a IA generativa e onde o Couchbase se encaixa no mundo da IA generativa.
O que é IA generativa?
IA (Inteligência Artificial) geradora é o termo categórico usado para descrever algoritmos de criação de conteúdo que usam Modelos de Linguagem Grandes (LLMs) para construir novo conteúdo com base no conhecimento baseado em similaridade que o LLM acumulou. O conteúdo gerado pode ser texto, código, gráficos, imagens, áudio, fala, música ou vídeo. O LLM é interrogado por meio de prompts que sugerem o tópico e o formato da saída desejada por um usuário ou um programa. O conteúdo resultante é gerado e refinado pelo modelo, daí o termo "IA generativa".
Como funciona a IA generativa?
A IA generativa nasceu dos avanços no processamento de linguagem natural (NLP) e no processamento de imagens, que ajudaram a identificar o significado pretendido de uma frase e a reconhecer objetos como árvores e rochas em uma imagem. Cada um desses exemplos foi criado usando algoritmos que detectam semelhanças. Por exemplo, um algoritmo poderia identificar que tigres e gatos malhados são tipos semelhantes de gatos. Em muitos casos, essas semelhanças são expressas em um grande número de dimensões, e o algoritmo criará representações numéricas como vetores que descrevem o grau de semelhança de um item ou frase com outro. Consulte nosso blog sobre pesquisa de vetores.
O desafio com esses algoritmos é que eles precisam ser treinados para reconhecer quando um item é semelhante a outro item já reconhecido. Esse treinamento requer a alimentação dos modelos com grandes quantidades de dados, permitindo que o modelo componha e expanda seu campo de reconhecimento. Alguns LLMs foram treinados por meio da varredura de todo o conteúdo da Internet para construir sua base de conhecimento e compreensão.
Exemplos de ferramentas de IA generativa
Os principais participantes da criação e do acesso a modelos de IA generativa incluem AWS, Aberto.AI, Microsoft, Google, Meta e Antrópica. Cada um deles lançou seus próprios modelos em versões gratuitas e empresariais. Acreditamos que esses fornecedores criarão uma força gravitacional centralizadora com seus LLMs, semelhante ao que fizeram com seus serviços sociais e de nuvem, pois o gerenciamento de LLMs consome muitos recursos.
Também estamos vendo o surgimento de milhares de plug-ins de navegador de IA generativa, como exemplificado neste Artigo da ZDNet. Esses plug-ins estão ajudando os usuários finais na criação de conteúdo de todos os tipos. Para o Couchbase, anunciamos a prévia privada de nosso próprio assistente de codificação gerativo com base em IA, Couchbase iQ.
Por que o Couchbase é um jogador em aplicativos gerados por IA
O Couchbase já está sendo usado como uma plataforma de dados para Aplicativos com tecnologia de IA. Há vários motivos para isso, incluindo o valor e a flexibilidade do formato de dados JSON, a versatilidade dos padrões de acesso a dados oferecidos pelo Couchbase e a introdução de nosso mais novo recurso, Couchbase Capella iQ.
JSON é um formato de dados ideal para dados orientados para IA
A engenharia de prompts é o processo de criação de prompts de IA generativos que contêm a quantidade adequada de dados contextuais para receber uma resposta relevante e precisa de um LLM. A engenharia de prompts é um campo de especialização em rápido crescimento e o JSON é um formato ideal para armazenar dados de prompts. Considere isso:
-
- Um documento JSON pode conter dados e metadados sobre esses dados em um único documento para alimentar prompts.
- O JSON é incrivelmente popular para armazenar informações de perfil de conta, incluindo atributos destinados à personalização e à experiência do usuário.
- O JSON também pode conter cadeias de prompt completas, o que pode ajudar a manter o contexto da conversa de sessão para sessão. Isso é importante porque a maioria dos LLMs não tem estado e não mantém o contexto da conversa que está conduzindo.
Cada uma dessas observações mostra por que o JSON é o formato de dados ideal para IA generativa.
A complexidade dos dados é o inimigo da IA generativa
Reconhecemos que a IA generativa lida com semelhanças, e não com especificidades. Dessa forma, as informações derivadas fornecidas por conversas de IA generativa podem sofrer alucinações. Uma alucinação de IA generativa pode se parecer com um fato real, mas não pode ser rastreada até ele. Isso destaca a natureza imprecisa da IA generativa. Para minimizar as alucinações e melhorar a precisão da IA, acreditamos que as arquiteturas de dados devem ser simplificadas. No entanto, muitos aplicativos são alimentados por vários bancos de dados, cada um dos quais executa sua própria operação discreta, como sessões de cache, atualização de perfis de usuário em JSON, gerenciamento de transações relacionais, pesquisa de texto e locais, acionamento de eventos, varredura de logs de séries temporais ou pesquisa de incorporação de vetores para IA.
No entanto, a complexidade do uso de vários bancos de dados para cada um desses padrões de acesso pode confundir os LLMs quando os prompts são derivados de várias fontes. Esperamos que os arquitetos de dados percebam que seus prompts de IA generativa precisarão de uma arquitetura de dados limpa e simples e de um único pool de dados de prompts para melhorar a precisão dos resultados do LLM.
É por isso que um aplicativo com base no Couchbase, que aproveita todos os padrões de acesso mencionados acima, não só ajudará a reduzir o custo de arquitetura, mas também criará dados mais limpos e precisos para informar os modelos de IA.
Os LLMs de IA geradora são centralizados, mas a utilização da IA é descentralizada na borda
As interações de IA geradora com grandes modelos de linguagem são uma força gravitacional centralizadora para os principais CSPs devido aos seus requisitos extremamente altos de processamento e infraestrutura. Mas a criação de dados de IA e o consumo de resultados de LLM ocorrem na borda e em dispositivos móveis. Isso é especialmente verdadeiro quando o aplicativo é voltado para o usuário final e fornece conteúdo hiperpersonalizado. Os aplicativos móveis são distribuídos e frequentemente desconectados. Explicamos esse fenômeno em nosso blog recente sobre A nova pilha.
O Couchbase pode preencher a lacuna de precisão da IA generativa
A IA generativa, embora poderosa, carece de precisão em muitas de suas respostas. Isso pode criar novos desafios para os desenvolvedores:
-
- Como preencher a lacuna entre a precisão dos recursos tradicionais de DBMS, como transações e consultas SQL, e a imprecisão dos resultados criados por IA.
- Usando o Couchbase Capella iQ, os desenvolvedores podem se apoiar na precisão do SQL++ e em transações ACID distribuídas e com vários documentos para ajudar a melhorar a precisão de um aplicativo alimentado por IA criado com o Couchbase Capella.
O Couchbase é a plataforma de dados para aplicativos com tecnologia de IA
Os clientes do Couchbase já estão criando Aplicativos com tecnologia de IA porque seus aplicativos precisam dos recursos fundamentais do Couchbase, incluindo:
Desempenho do aplicativo
-
-
- Cache de alta velocidade na memória para capacidade de resposta
- Baixa latência, mesmo na borda, onde os dados direcionados à IA são criados e consumidos
- Ajuste de desempenho para isolar e otimizar as cargas de trabalho no cluster
-
Versatilidade
-
-
- JSON para armazenar dados operacionais, seus metadados, suas matrizes de pesquisa e sequências de prompt
- Serviços de acesso multimodelo para pesquisa de chave/valor, texto e geográfica, alterações em documentos, dados de séries temporais, captura e transmissão de eventos, consultas recursivas (passagem de gráficos) e processamento analítico operacional
- Consultas preditivas no Couchbase Lite.
- Precisão e facilidade da linguagem de consulta SQL++.
- Processamento de borda, sincronização de dados hierárquicos e sincronização ponto a ponto entre instâncias de bancos de dados móveis incorporados localmente (Couchbase Lite).
-
Escalabilidade empresarial
-
-
- Clustering distribuído e geográfico
- Suporte para implantações de várias nuvens, DBaaS, Kubernetes e autogerenciadas
- Transações ACID confiáveis (patenteadas), distribuídas e com vários documentos, quando necessário.
- Segurança de nível empresarial e certificações para PCI, HIPAA e SOC 2 Tipo II.
-
O Couchbase usará IA para gerenciar e operar o banco de dados como serviço Capella?
Sim, o Couchbase está explorando maneiras de usar a IA para dar suporte a atividades operacionais, como dimensionamento de cluster, dimensionamento, reequilíbrio, automação de borda e muito mais.
Conclusão: O Couchbase está pronto para a IA generativa
A Couchbase continuará a incorporar recursos de IA em toda a sua linha de produtos, concentrando-se especificamente em:
-
- Aumento da produtividade do desenvolvedor com a introdução de recursos como o Capella iQ
- Otimização do processamento de IA na plataforma Couchbase
- Habilitando aplicativos orientados por IA em qualquer lugar, inclusive na borda
- Criação de um ecossistema vibrante de parceiros de IA
Como posso experimentar o Capella iQ?
O Couchbase está oferecendo prévias privadas da tecnologia para a comunidade do Couchbase.