Em 2023, as empresas mudaram rapidamente suas prioridades, deixando de se concentrar na expansão das pilhas de tecnologia para maximizar a eficiência por meio da consolidação e de estratégias econômicas. No entanto, com a ascensão da IA, as empresas enfrentam novos riscos na adoção da tecnologia. Existem estratégias específicas que os líderes de TI e de negócios podem - e devem - adotar para aproveitar a IA e a tecnologia de ponta de forma segura e eficaz. Abaixo estão minhas principais previsões para 2024, com foco na qualidade dos dados, onde os dados devem residir e como os bancos de dados permitirão uma nova fronteira para aplicativos modernos.
Publicado originalmente em vmblog.com.
A geração aumentada por recuperação será fundamental para obter resultados contextuais e fundamentados ao aproveitar a IA
O entusiasmo em torno dos modelos de linguagem de grande porte e seus recursos de geração continuará a trazer consigo um fenômeno problemático de alucinações de modelos. Esses são os casos em que os modelos produzem resultados que, embora coerentes, podem estar desvinculados da realidade factual ou do contexto da entrada.
À medida que as empresas modernas avançam, será importante desmistificar as alucinações da IA e implementar uma técnica emergente chamada Retrieval-Augmented Generation (RAG) que, quando associada a dados contextuais em tempo real, pode reduzir essas alucinações, melhorando a precisão e o valor do modelo. A RAG traz o contexto sobre a empresa ou o usuário, reduzindo as alucinações e aumentando a veracidade e a utilidade.
Os dados em tempo real se tornarão o padrão para que as empresas possam gerar experiências generativas com IA; as camadas de dados devem oferecer suporte à análise transacional e em tempo real
O crescimento explosivo de IA generativa em 2023 continuará forte em 2024. Além disso, as empresas integrarão a IA generativa para potencializar os aplicativos de dados em tempo real e criar soluções dinâmicas e adaptáveis baseadas em IA. À medida que a IA se torna essencial para os negócios, as organizações precisam garantir que os dados que sustentam os modelos de IA sejam baseados na verdade e na realidade, aproveitando dados o mais atualizados possível.
Assim como alimentos, cartões-presente e medicamentos, os dados também têm uma data de validade. Para que a IA generativa seja realmente eficaz, precisa e forneça resultados contextualmente relevantes, ela deve ser desenvolvida com base em dados atualizados continuamente e em tempo real. O crescente apetite por insights em tempo real impulsionará a adoção de tecnologias que permitam o processamento e a análise de dados em tempo real. Em 2024 e nos anos seguintes, as empresas aproveitarão cada vez mais uma camada de dados que ofereça suporte à análise transacional e em tempo real para tomar decisões oportunas e responder instantaneamente à dinâmica do mercado.
Espere uma mudança de paradigma da IA centrada em modelos para a IA centrada em dados
Os dados são fundamentais no aprendizado de máquina moderno, mas precisam ser abordados e tratados adequadamente nos projetos de IA. Como a IA atual adota uma abordagem centrada no modelo, centenas de horas são desperdiçadas no ajuste de um modelo criado com dados de baixa qualidade.
À medida que os modelos de IA amadurecem, evoluem e aumentam, o foco mudará para aproximar os modelos dos dados, e não o contrário. A IA centrada em dados permitirá que as organizações forneçam experiências geradoras e preditivas baseadas nos dados mais recentes. Isso melhorará significativamente o resultado dos modelos e reduzirá as alucinações.
As empresas aproveitarão os copilotos de IA para obter insights mais rápidos sobre o tempo
A integração da IA e do aprendizado de máquina nos processos de gerenciamento de dados e nas ferramentas de análise continuará a evoluir. Com o surgimento da tecnologia de IA generativa, as empresas precisam de uma maneira de interagir com a IA e com os dados que ela produz em um nível contextual. Aproveitando dados e análises aumentados, as empresas começarão a criar copilotos de IA em seus produtos para obter insights mais rápidos. Com a capacidade de entender e processar grandes quantidades de dados, os copilotos atuam como assistentes dos modelos de IA para classificar os dados e gerar práticas recomendadas e recomendações.
O aumento de dados é uma ferramenta poderosa que mudará a maneira como as empresas estão criando infraestrutura e aplicativos nos próximos anos, pois o gerenciamento de dados aumentado automatizará a qualidade dos dados de rotina e as tarefas de integração de dados, enquanto a análise aumentada fornecerá insights avançados e automatizará a tomada de decisões orientada por dados.
Os LLMs e bancos de dados multimodais permitirão uma nova fronteira de aplicativos de IA em todos os setores
Uma das tendências mais interessantes para 2024 será o surgimento de LLMs multimodais. Com esse surgimento, cresceu a necessidade de bancos de dados multimodais que possam armazenar, gerenciar e permitir consultas eficientes em diversos tipos de dados. No entanto, o tamanho e a complexidade dos conjuntos de dados multimodais representam um desafio para os bancos de dados tradicionais, que normalmente são projetados para armazenar e consultar um único tipo de dados, como texto ou imagens.
Os bancos de dados multimodais, por outro lado, são muito mais versáteis e poderosos. Eles representam uma progressão natural na evolução dos LLMs para incorporar os diferentes aspectos do processamento e da compreensão de informações usando várias modalidades, como texto, imagens, áudio e vídeo. Haverá vários casos de uso e setores que se beneficiarão diretamente da abordagem multimodal, incluindo saúde, robótica, comércio eletrônico, educação, varejo e jogos. Os bancos de dados multimodais terão um crescimento e investimentos significativos em 2024 e nos anos seguintes, para que as empresas possam continuar a impulsionar os aplicativos alimentados por IA.
A IA de borda potencializará a inferência em tempo real e as otimizações avançadas de modelos
A convergência da IA e da computação de borda continuará a amadurecer, permitindo uma análise mais robusta em tempo real e a tomada de decisões na borda. Os recursos aprimorados de IA de borda reduzirão a necessidade de transmissão de dados para os locais centrais na nuvem, garantindo respostas mais rápidas e melhor preservação da privacidade.
À medida que os benefícios da IA de borda e da inferência mais próxima do aplicativo e dos dados se tornarem evidentes, as organizações começarão a procurar várias pilhas de inferência de borda e bancos de dados para processar os dados localmente. Essa inferência distribuída permite que os modelos sejam treinados em vários dispositivos ou servidores que mantêm amostras de dados locais, sem trocá-los e abordando as questões de privacidade e conformidade dos dados. Isso, combinado com a IA de borda, permitirá o processamento eficiente de dados em dispositivos locais, reduzindo a latência e garantindo a privacidade dos dados.
O poder da IA estará enraizado em seus dados em 2024
As empresas em todo o mundo abriram uma abundância de novas oportunidades com a IA. Agora, os líderes de negócios e de TI precisam se concentrar na tomada de decisões orientada por dados para colher os benefícios da IA em aplicativos modernos. Ao adotar uma abordagem de IA centrada em dados, aproveitando os dados em tempo real e adotando as habilidades de inferência da IA de borda combinada com o poder de aumento de dados dos copilotos de IA, as empresas estarão mais bem posicionadas para ter sucesso em suas iniciativas transformadoras no futuro.
Saiba mais
O que você acha dessas previsões de tendências? Acompanhe nossos vários desenvolvimentos de IA por meio deste blog: