Como a IA ajuda você a encaixar máquinas virtuais e reduzir o desperdício na nuvem
6 meses ago · Updated 6 meses ago

- Ouça este artigo
- IA muda a forma como você vê a alocação de máquinas virtuais em nuvem
- O problema que afeta sua infraestrutura
- Como a abordagem funciona
- Os três algoritmos em destaque
- Tabela resumo dos algoritmos
- Desdobramentos de implantação
- Resultados e impactos práticos
- O que isso significa para você
- Conclusão
- Perguntas frequentes
Ouça este artigo
Você já imaginou um jogo tipo Tetris para servidores? Neste artigo você vai ver como a IA usa repredição contínua para prever quanto tempo cada máquina virtual vai rodar e assim aumentar a eficiência dos data centers. Isso permite que LAVA, NILAS e LARS encaixem cargas de forma mais inteligente. O modelo foi compilado direto no gerenciador para manter baixa latência e alta confiabilidade. Leia e descubra como isso reduz desperdício e torna seu uso de servidores muito mais eficiente.
Detalhes do estudo: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/
- Modelo prevê distribuições de vida de VMs e reprediz conforme elas rodem
- NILAS agrupa VMs com saídas parecidas para criar hosts vazios
- LAVA preenche lacunas colocando VMs curtas em hosts com VMs longas e se adapta a erros
- LARS reduz migrações ao migrar primeiro as VMs com maior tempo restante
- Modelo foi incorporado ao escalonador para baixa latência e implantação segura em produção
IA muda a forma como você vê a alocação de máquinas virtuais em nuvem
Pesquisadores anunciaram um conjunto de técnicas que reduzem desperdício de recursos em grandes centros de dados. A novidade central é um sistema que usa repredição contínua para ajustar onde e por quanto tempo cada VM deve ficar em um servidor. NILAS já está em produção desde início de 2024, e testes mostram ganhos adicionais com LAVA e LARS. O modelo foi integrado diretamente ao agendador do cluster e atinge latências de inferência de 9 µs, permitindo atualizações frequentes sem afetar a confiabilidade.
(Leitura técnica: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/)
O problema que afeta sua infraestrutura
Imagine que você está empilhando peças num jogo de encaixe: algumas peças somem rápido, outras ficam por muito tempo. Datacenters enfrentam isso constantemente. Sem saber por quanto tempo uma VM ficará ativa, você corre o risco de deixar recursos presos ou fragmentados — o que aumenta custos e impacto ambiental.
Dados indicam um padrão comum:
- A maioria (88%) vive menos de 1 hora, mas consome apenas ~2% dos recursos.
- Jobs entre 0–10 min representam 53% dos casos, com uso de recursos muito baixo.
- Jobs com >30 dias são poucos, mas consomem cerca de 18% dos recursos.
Como a abordagem funciona
A proposta principal é prever não um único valor, mas uma distribuição de probabilidade para a vida restante de cada VM. Assim o sistema pode perguntar continuamente: "Dado que esta VM já está ativa por X dias, quanto tempo ainda deve ficar?" Essas previsões mudam com o tempo — e o agendador usa as atualizações para tomar decisões melhores, evitando decisões baseadas numa única estimativa fixa.
Os três algoritmos em destaque
NILAS
- O que faz: ajusta pontuações de hospedagem existentes para favorecer servidores cujas VMs devem terminar em janelas similares.
- Objetivo: criar máquinas vazias com menos risco de manter recursos presos.
- Estado: em produção (Borg) desde início de 2024.
LAVA
- O que faz: coloca VMs curtas em servidores que já têm VMs longas, preenchendo espaços temporários sem prolongar a vida do host.
- Objetivo: minimizar fragmentação e recuperar servidores mais rápido.
- Adaptação: ajusta a expectativa do host quando uma VM excede sua previsão.
LARS
- O que faz: ordena VMs por tempo restante previsto durante operações de desfragmentação e manutenção, migrando primeiro as VMs de maior duração.
- Objetivo: reduzir migrações ao deixar VMs curtas saírem naturalmente.
- Impacto estimado: diminuição de cerca de 4,5% no número total de migrações.
Tabela resumo dos algoritmos
| Algoritmo | Função principal | Benefício principal |
|---|---|---|
| NILAS | Pontuação não invasiva com previsões contínuas | Mais hosts livres; já em produção |
| LAVA | Alocação que mistura VMs curtas com VMs longas | Menos fragmentação; ganho adicional estimado |
| LARS | Reordena e migra VMs com base no tempo restante | Menos migrações durante manutenção |
Desdobramentos de implantação
Os autores evitaram servir modelos em servidores separados para não criar dependência circular com o agendador; em vez disso, o modelo foi compilado diretamente no binário do agendador. Isso:
- evitou pontos únicos de falha;
- reduziu a latência média de previsão para 9 µs (≈780× mais rápido que inferência remota);
- permitiu repredições frequentes sem impacto perceptível no desempenho.
Para lidar com o alto volume de previsões, foi implementado um cache de score de vida do host que só atualiza quando necessário (adição/remoção de VMs ou expiração prevista).
Resultados e impactos práticos
- NILAS mostrou ganhos mensuráveis em produção desde 2024.
- Simulações indicam que LAVA pode adicionar cerca de 0,4 pontos percentuais de eficiência sobre NILAS.
- LARS pode reduzir migrações em manutenção em ~4,5%.
- As técnicas são projetadas para serem generalizáveis e integráveis em camadas baixas do sistema sem sacrificar confiabilidade.
O que isso significa para você
- Se você gerencia infraestrutura em nuvem, previsões contínuas podem melhorar a utilização dos seus servidores.
- Compilar modelos no escalonador aumenta resiliência e reduz latência, mas exige integração cuidadosa.
- A combinação de previsões em distribuição e políticas que reagem a erros de previsão pode reduzir desperdício e trabalho operacional.
Para aprofundar a implementação e detalhes de engenharia, confira: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/
Conclusão
Tratar alocação de VMs como um jogo de Tetris faz sentido: a chave é a repredição contínua — prever uma distribuição de vida, não um palpite fixo. Com isso, algoritmos como NILAS, LAVA e LARS reduzem desperdício, diminuem migrações e recuperam hosts mais rápido. Integrar o modelo direto no scheduler permite repredições frequentes (latência ≈9 µs) sem travar o sistema. Pequenas mudanças aqui podem virar grandes economias em escala.
Quer explorar mais? Leitura técnica e detalhes de pesquisa em: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/
Mais conteúdo prático: https://blog.aidirectory.com.br
Perguntas frequentes
Q: O que é LAVA e como ele reduz desperdício na nuvem?
A: LAVA é um algoritmo de alocação que coloca VMs curtas em servidores com VMs longas, enchendo buracos temporários sem estender a vida do host. Resultado: menos capacidade perdida e mais servidores livres.
Q: O que significa "repredição contínua" e por que é útil?
A: É atualizar sempre a previsão de vida restante das VMs. À medida que a VM roda, a previsão melhora, evitando decisões ruins baseadas numa única estimativa. Menos erros = menos hosts presos por engano.
Q: Como NILAS, LAVA e LARS se complementam?
A: NILAS rankeia hosts para criar máquinas vazias; LAVA preenche espaços com VMs curtas sem estender hosts; LARS migra prioritariamente VMs longas durante manutenção. Juntos reduzem fragmentação e migrações desnecessárias.
Q: Por que compilar o modelo direto no scheduler faz diferença?
A: Evita dependência de servidores de inferência, elimina risco de falha em cascata e oferece latências em microssegundos, permitindo repredições frequentes sem travar o sistema.
Q: Quais ganhos práticos esperar ao usar essas ideias?
A: Menos "resource stranding", mais hosts livres, ganhos medidos em produção por NILAS, simulações com LAVA (0,4 pp) e redução de migrações com LARS (~4,5%), traduzindo-se em economia de custo e energia em larga escala.
Referências:
- https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/
- https://blog.aidirectory.com.br
Se você quiser conhecer outros artigos semelhantes a Como a IA ajuda você a encaixar máquinas virtuais e reduzir o desperdício na nuvem, você pode visitar a categoria Dicas.
