Como a IA ajuda você a encaixar máquinas virtuais e reduzir o desperdício na nuvem

Neste artigo:

Ouça este artigo
IA muda a forma como você vê a alocação de máquinas virtuais em nuvem
O problema que afeta sua infraestrutura
Como a abordagem funciona
Os três algoritmos em destaque
NILAS
LAVA
LARS
Tabela resumo dos algoritmos
Desdobramentos de implantação
Resultados e impactos práticos
O que isso significa para você
Conclusão
Perguntas frequentes

Ouça este artigo

Você já imaginou um jogo tipo Tetris para servidores? Neste artigo você vai ver como a IA usa repredição contínua para prever quanto tempo cada máquina virtual vai rodar e assim aumentar a eficiência dos data centers. Isso permite que LAVA, NILAS e LARS encaixem cargas de forma mais inteligente. O modelo foi compilado direto no gerenciador para manter baixa latência e alta confiabilidade. Leia e descubra como isso reduz desperdício e torna seu uso de servidores muito mais eficiente.

Detalhes do estudo: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/

Modelo prevê distribuições de vida de VMs e reprediz conforme elas rodem

NILAS agrupa VMs com saídas parecidas para criar hosts vazios

LAVA preenche lacunas colocando VMs curtas em hosts com VMs longas e se adapta a erros

LARS reduz migrações ao migrar primeiro as VMs com maior tempo restante

Modelo foi incorporado ao escalonador para baixa latência e implantação segura em produção

IA muda a forma como você vê a alocação de máquinas virtuais em nuvem

Pesquisadores anunciaram um conjunto de técnicas que reduzem desperdício de recursos em grandes centros de dados. A novidade central é um sistema que usa repredição contínua para ajustar onde e por quanto tempo cada VM deve ficar em um servidor. NILAS já está em produção desde início de 2024, e testes mostram ganhos adicionais com LAVA e LARS. O modelo foi integrado diretamente ao agendador do cluster e atinge latências de inferência de 9 µs, permitindo atualizações frequentes sem afetar a confiabilidade.

(Leitura técnica: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/)

O problema que afeta sua infraestrutura

Imagine que você está empilhando peças num jogo de encaixe: algumas peças somem rápido, outras ficam por muito tempo. Datacenters enfrentam isso constantemente. Sem saber por quanto tempo uma VM ficará ativa, você corre o risco de deixar recursos presos ou fragmentados — o que aumenta custos e impacto ambiental.

Dados indicam um padrão comum:

A maioria (88%) vive menos de 1 hora, mas consome apenas ~2% dos recursos.

Jobs entre 0–10 min representam 53% dos casos, com uso de recursos muito baixo.

Jobs com >30 dias são poucos, mas consomem cerca de 18% dos recursos.

Como a abordagem funciona

A proposta principal é prever não um único valor, mas uma distribuição de probabilidade para a vida restante de cada VM. Assim o sistema pode perguntar continuamente: “Dado que esta VM já está ativa por X dias, quanto tempo ainda deve ficar?” Essas previsões mudam com o tempo — e o agendador usa as atualizações para tomar decisões melhores, evitando decisões baseadas numa única estimativa fixa.

Os três algoritmos em destaque

NILAS

O que faz: ajusta pontuações de hospedagem existentes para favorecer servidores cujas VMs devem terminar em janelas similares.

Objetivo: criar máquinas vazias com menos risco de manter recursos presos.

Estado: em produção (Borg) desde início de 2024.

LAVA

O que faz: coloca VMs curtas em servidores que já têm VMs longas, preenchendo espaços temporários sem prolongar a vida do host.

Objetivo: minimizar fragmentação e recuperar servidores mais rápido.

Adaptação: ajusta a expectativa do host quando uma VM excede sua previsão.

LARS

O que faz: ordena VMs por tempo restante previsto durante operações de desfragmentação e manutenção, migrando primeiro as VMs de maior duração.

Objetivo: reduzir migrações ao deixar VMs curtas saírem naturalmente.

Impacto estimado: diminuição de cerca de 4,5% no número total de migrações.

Tabela resumo dos algoritmos

Algoritmo	Função principal	Benefício principal
NILAS	Pontuação não invasiva com previsões contínuas	Mais hosts livres; já em produção
LAVA	Alocação que mistura VMs curtas com VMs longas	Menos fragmentação; ganho adicional estimado
LARS	Reordena e migra VMs com base no tempo restante	Menos migrações durante manutenção

Desdobramentos de implantação

Os autores evitaram servir modelos em servidores separados para não criar dependência circular com o agendador; em vez disso, o modelo foi compilado diretamente no binário do agendador. Isso:

evitou pontos únicos de falha;

reduziu a latência média de previsão para 9 µs (≈780× mais rápido que inferência remota);

permitiu repredições frequentes sem impacto perceptível no desempenho.

Para lidar com o alto volume de previsões, foi implementado um cache de score de vida do host que só atualiza quando necessário (adição/remoção de VMs ou expiração prevista).

Resultados e impactos práticos

NILAS mostrou ganhos mensuráveis em produção desde 2024.

Simulações indicam que LAVA pode adicionar cerca de 0,4 pontos percentuais de eficiência sobre NILAS.

LARS pode reduzir migrações em manutenção em ~4,5%.

As técnicas são projetadas para serem generalizáveis e integráveis em camadas baixas do sistema sem sacrificar confiabilidade.

O que isso significa para você

Se você gerencia infraestrutura em nuvem, previsões contínuas podem melhorar a utilização dos seus servidores.

Compilar modelos no escalonador aumenta resiliência e reduz latência, mas exige integração cuidadosa.

A combinação de previsões em distribuição e políticas que reagem a erros de previsão pode reduzir desperdício e trabalho operacional.

Para aprofundar a implementação e detalhes de engenharia, confira: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/

Conclusão

Tratar alocação de VMs como um jogo de Tetris faz sentido: a chave é a repredição contínua — prever uma distribuição de vida, não um palpite fixo. Com isso, algoritmos como NILAS, LAVA e LARS reduzem desperdício, diminuem migrações e recuperam hosts mais rápido. Integrar o modelo direto no scheduler permite repredições frequentes (latência ≈9 µs) sem travar o sistema. Pequenas mudanças aqui podem virar grandes economias em escala.

Quer explorar mais? Leitura técnica e detalhes de pesquisa em: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/
Mais conteúdo prático: https://blog.aidirectory.com.br

Perguntas frequentes

Q: O que é LAVA e como ele reduz desperdício na nuvem?
A: LAVA é um algoritmo de alocação que coloca VMs curtas em servidores com VMs longas, enchendo buracos temporários sem estender a vida do host. Resultado: menos capacidade perdida e mais servidores livres.

Q: O que significa “repredição contínua” e por que é útil?
A: É atualizar sempre a previsão de vida restante das VMs. À medida que a VM roda, a previsão melhora, evitando decisões ruins baseadas numa única estimativa. Menos erros = menos hosts presos por engano.

Q: Como NILAS, LAVA e LARS se complementam?
A: NILAS rankeia hosts para criar máquinas vazias; LAVA preenche espaços com VMs curtas sem estender hosts; LARS migra prioritariamente VMs longas durante manutenção. Juntos reduzem fragmentação e migrações desnecessárias.

Q: Por que compilar o modelo direto no scheduler faz diferença?
A: Evita dependência de servidores de inferência, elimina risco de falha em cascata e oferece latências em microssegundos, permitindo repredições frequentes sem travar o sistema.

Q: Quais ganhos práticos esperar ao usar essas ideias?
A: Menos “resource stranding”, mais hosts livres, ganhos medidos em produção por NILAS, simulações com LAVA (0,4 pp) e redução de migrações com LARS (~4,5%), traduzindo-se em economia de custo e energia em larga escala.

Referências:

https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/

https://blog.aidirectory.com.br

🤖 Encontre as Melhores Ferramentas de IA

Ouça este artigo

🤖 Encontre as Melhores Ferramentas de IA

IA muda a forma como você vê a alocação de máquinas virtuais em nuvem

O problema que afeta sua infraestrutura

Como a abordagem funciona

Os três algoritmos em destaque

NILAS

LAVA

LARS

Tabela resumo dos algoritmos

Desdobramentos de implantação

Resultados e impactos práticos

O que isso significa para você

Conclusão

Perguntas frequentes

🤖 Encontre as Melhores Ferramentas de IA

Você também pode gostar