IA generativa e a computação de borda podem trabalhar em sinergia para fornecer insights personalizados e inteligentes em escala. O processamento de grandes volumes de dados na borda, mais próximo do ponto de geração ou consumo, economiza custos de largura de banda, evitando a necessidade de transferir os dados para a nuvem para análise. Além disso, os insights na borda estão sempre disponíveis, mesmo que a conectividade com a nuvem seja limitada ou inexistente. As organizações estão investindo em ferramentas e tecnologias de IA não apenas para aumentar o valor para seus clientes, mas também para reduzir os custos operacionais, aumentando a produtividade e a eficiência dos desenvolvedores.
Publicado originalmente em vmblog.com.
A única maneira de dimensionar os aplicativos de IA será distribuí-los, com a ajuda da computação de borda
Prevejo que a convergência da IA de borda e de nuvem é a maneira de fornecer IA em escala, com a nuvem e a borda transferindo tarefas computacionais para o outro lado, conforme necessário. Por exemplo, a borda pode lidar com inferências de modelos, enquanto a nuvem pode lidar com o treinamento de modelos. Ou a borda pode transferir consultas para a nuvem com base em heurísticas, como a duração de um prompt.
Quando se trata de uma estratégia de IA bem-sucedida, o custo seria proibitivo se toda a computação de IA fosse executada apenas na nuvem. Juntamente com os requisitos de energia e potência, as taxas de saída do data center na nuvem, os custos operacionais do fornecimento de computação de IA podem ser muito altos. As empresas precisam considerar uma estratégia de computação de borda - em conjunto com a nuvem - para permitir previsões de IA personalizadas, em tempo real e de baixa latência, de forma econômica, com uma pegada de carbono menor e sem comprometer a privacidade e a soberania dos dados.
O sucesso da IA de borda dependerá dos avanços nos modelos de IA leves
Para tornar a IA de borda uma opção viável, os modelos de IA precisam ser leves e capazes de ser executados em dispositivos incorporados e servidores de borda com recursos limitados e, ao mesmo tempo, continuar a fornecer resultados com níveis aceitáveis de precisão.
Os modelos precisam atingir o equilíbrio certo, ou seja, devem ser pequenos e menos intensivos em termos de computação e eficientes em termos de energia para que possam ser executados com eficiência na borda e, ao mesmo tempo, fornecer resultados precisos. Embora tenha havido muito progresso na compactação de modelos, prevejo que haverá inovação contínua nesse espaço, o que, juntamente com os avanços nos processadores, tornará a IA de borda onipresente.
As ferramentas de IA separarão os bons desenvolvedores dos excepcionais, desempenhando um papel fundamental na produtividade do desenvolvedor
Os bons desenvolvedores se apoiarão nas ferramentas de IA para aliviar sua carga de trabalho. Os desenvolvedores excepcionais usarão ferramentas e assistentes de IA para aumentar a produtividade em tarefas repetitivas e mundanas, de modo que possam se concentrar mais em ser criativos, resolver os problemas difíceis e lidar com as tarefas de maior valor que promovem a inovação.
Embora eu alerte contra o fato de os desenvolvedores dependerem demais das ferramentas de IA e se apoiarem em ferramentas de produtividade para fazer todo ou a maior parte do trabalho por eles, a realidade é que a IA continuará a desempenhar um papel fundamental na produtividade dos desenvolvedores. Os desenvolvedores devem entender as limitações dessas ferramentas e ter bom senso ao usá-las, pois o uso excessivo pode sufocar a inovação e o pensamento crítico. Além disso, os resultados podem não ser os mais precisos, atualizados ou a maneira mais eficiente de resolver o problema.
A computação de borda, os modelos leves de IA e o foco em capacitar os desenvolvedores farão a IA avançar em 2024
Os modelos leves de IA, juntamente com as inovações de hardware na borda e a convergência da IA na borda e na nuvem, serão fundamentais para uma estratégia de IA bem-sucedida em 2024 e nos anos seguintes. Além disso, as organizações de engenharia continuarão buscando maneiras de aproveitar as ferramentas e os assistentes de IA para acelerar a produtividade do desenvolvedor e, ao mesmo tempo, promover a criatividade e a inovação. No próximo ano, estou ansioso para ver como as organizações expandem o uso da IA generativa para evoluir ainda mais suas operações e criar soluções inovadoras para seus clientes, transferindo as cargas de trabalho para a borda.
Saiba mais
O que você acha dessas previsões de tendências? Acompanhe nossos vários desenvolvimentos de IA por meio deste blog: