Como a IA ajuda você a encaixar máquinas virtuais e reduzir o desperdício na nuvem

6 meses ago · Updated 6 meses ago

como-a-ia-ajuda-voce-a-encaixar-maquinas-virtuais-e-reduzir-o-desperdicio-na-nuvem
Table
  1. Ouça este artigo
  2. IA muda a forma como você vê a alocação de máquinas virtuais em nuvem
  3. O problema que afeta sua infraestrutura
  4. Como a abordagem funciona
  5. Os três algoritmos em destaque
    1. NILAS
    2. LAVA
    3. LARS
  6. Tabela resumo dos algoritmos
  7. Desdobramentos de implantação
  8. Resultados e impactos práticos
  9. O que isso significa para você
  10. Conclusão
  11. Perguntas frequentes

Ouça este artigo


Você já imaginou um jogo tipo Tetris para servidores? Neste artigo você vai ver como a IA usa repredição contínua para prever quanto tempo cada máquina virtual vai rodar e assim aumentar a eficiência dos data centers. Isso permite que LAVA, NILAS e LARS encaixem cargas de forma mais inteligente. O modelo foi compilado direto no gerenciador para manter baixa latência e alta confiabilidade. Leia e descubra como isso reduz desperdício e torna seu uso de servidores muito mais eficiente.

Detalhes do estudo: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/

  • Modelo prevê distribuições de vida de VMs e reprediz conforme elas rodem
  • NILAS agrupa VMs com saídas parecidas para criar hosts vazios
  • LAVA preenche lacunas colocando VMs curtas em hosts com VMs longas e se adapta a erros
  • LARS reduz migrações ao migrar primeiro as VMs com maior tempo restante
  • Modelo foi incorporado ao escalonador para baixa latência e implantação segura em produção

IA muda a forma como você vê a alocação de máquinas virtuais em nuvem

Pesquisadores anunciaram um conjunto de técnicas que reduzem desperdício de recursos em grandes centros de dados. A novidade central é um sistema que usa repredição contínua para ajustar onde e por quanto tempo cada VM deve ficar em um servidor. NILAS já está em produção desde início de 2024, e testes mostram ganhos adicionais com LAVA e LARS. O modelo foi integrado diretamente ao agendador do cluster e atinge latências de inferência de 9 µs, permitindo atualizações frequentes sem afetar a confiabilidade.

(Leitura técnica: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/)

O problema que afeta sua infraestrutura

Imagine que você está empilhando peças num jogo de encaixe: algumas peças somem rápido, outras ficam por muito tempo. Datacenters enfrentam isso constantemente. Sem saber por quanto tempo uma VM ficará ativa, você corre o risco de deixar recursos presos ou fragmentados — o que aumenta custos e impacto ambiental.

Dados indicam um padrão comum:

  • A maioria (88%) vive menos de 1 hora, mas consome apenas ~2% dos recursos.
  • Jobs entre 0–10 min representam 53% dos casos, com uso de recursos muito baixo.
  • Jobs com >30 dias são poucos, mas consomem cerca de 18% dos recursos.

Como a abordagem funciona

A proposta principal é prever não um único valor, mas uma distribuição de probabilidade para a vida restante de cada VM. Assim o sistema pode perguntar continuamente: "Dado que esta VM já está ativa por X dias, quanto tempo ainda deve ficar?" Essas previsões mudam com o tempo — e o agendador usa as atualizações para tomar decisões melhores, evitando decisões baseadas numa única estimativa fixa.

Os três algoritmos em destaque

NILAS

  • O que faz: ajusta pontuações de hospedagem existentes para favorecer servidores cujas VMs devem terminar em janelas similares.
  • Objetivo: criar máquinas vazias com menos risco de manter recursos presos.
  • Estado: em produção (Borg) desde início de 2024.

LAVA

  • O que faz: coloca VMs curtas em servidores que já têm VMs longas, preenchendo espaços temporários sem prolongar a vida do host.
  • Objetivo: minimizar fragmentação e recuperar servidores mais rápido.
  • Adaptação: ajusta a expectativa do host quando uma VM excede sua previsão.

LARS

  • O que faz: ordena VMs por tempo restante previsto durante operações de desfragmentação e manutenção, migrando primeiro as VMs de maior duração.
  • Objetivo: reduzir migrações ao deixar VMs curtas saírem naturalmente.
  • Impacto estimado: diminuição de cerca de 4,5% no número total de migrações.

Tabela resumo dos algoritmos

Algoritmo Função principal Benefício principal
NILAS Pontuação não invasiva com previsões contínuas Mais hosts livres; já em produção
LAVA Alocação que mistura VMs curtas com VMs longas Menos fragmentação; ganho adicional estimado
LARS Reordena e migra VMs com base no tempo restante Menos migrações durante manutenção

Desdobramentos de implantação

Os autores evitaram servir modelos em servidores separados para não criar dependência circular com o agendador; em vez disso, o modelo foi compilado diretamente no binário do agendador. Isso:

  • evitou pontos únicos de falha;
  • reduziu a latência média de previsão para 9 µs (≈780× mais rápido que inferência remota);
  • permitiu repredições frequentes sem impacto perceptível no desempenho.

Para lidar com o alto volume de previsões, foi implementado um cache de score de vida do host que só atualiza quando necessário (adição/remoção de VMs ou expiração prevista).

Resultados e impactos práticos

  • NILAS mostrou ganhos mensuráveis em produção desde 2024.
  • Simulações indicam que LAVA pode adicionar cerca de 0,4 pontos percentuais de eficiência sobre NILAS.
  • LARS pode reduzir migrações em manutenção em ~4,5%.
  • As técnicas são projetadas para serem generalizáveis e integráveis em camadas baixas do sistema sem sacrificar confiabilidade.

O que isso significa para você

  • Se você gerencia infraestrutura em nuvem, previsões contínuas podem melhorar a utilização dos seus servidores.
  • Compilar modelos no escalonador aumenta resiliência e reduz latência, mas exige integração cuidadosa.
  • A combinação de previsões em distribuição e políticas que reagem a erros de previsão pode reduzir desperdício e trabalho operacional.

Para aprofundar a implementação e detalhes de engenharia, confira: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/

Conclusão

Tratar alocação de VMs como um jogo de Tetris faz sentido: a chave é a repredição contínua — prever uma distribuição de vida, não um palpite fixo. Com isso, algoritmos como NILAS, LAVA e LARS reduzem desperdício, diminuem migrações e recuperam hosts mais rápido. Integrar o modelo direto no scheduler permite repredições frequentes (latência ≈9 µs) sem travar o sistema. Pequenas mudanças aqui podem virar grandes economias em escala.

Quer explorar mais? Leitura técnica e detalhes de pesquisa em: https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/
Mais conteúdo prático: https://blog.aidirectory.com.br

Perguntas frequentes

Q: O que é LAVA e como ele reduz desperdício na nuvem?
A: LAVA é um algoritmo de alocação que coloca VMs curtas em servidores com VMs longas, enchendo buracos temporários sem estender a vida do host. Resultado: menos capacidade perdida e mais servidores livres.

Q: O que significa "repredição contínua" e por que é útil?
A: É atualizar sempre a previsão de vida restante das VMs. À medida que a VM roda, a previsão melhora, evitando decisões ruins baseadas numa única estimativa. Menos erros = menos hosts presos por engano.

Q: Como NILAS, LAVA e LARS se complementam?
A: NILAS rankeia hosts para criar máquinas vazias; LAVA preenche espaços com VMs curtas sem estender hosts; LARS migra prioritariamente VMs longas durante manutenção. Juntos reduzem fragmentação e migrações desnecessárias.

Q: Por que compilar o modelo direto no scheduler faz diferença?
A: Evita dependência de servidores de inferência, elimina risco de falha em cascata e oferece latências em microssegundos, permitindo repredições frequentes sem travar o sistema.

Q: Quais ganhos práticos esperar ao usar essas ideias?
A: Menos "resource stranding", mais hosts livres, ganhos medidos em produção por NILAS, simulações com LAVA (0,4 pp) e redução de migrações com LARS (~4,5%), traduzindo-se em economia de custo e energia em larga escala.

Referências:

  • https://research.google/blog/solving-virtual-machine-puzzles-how-ai-is-optimizing-cloud-computing/
  • https://blog.aidirectory.com.br

Se você quiser conhecer outros artigos semelhantes a Como a IA ajuda você a encaixar máquinas virtuais e reduzir o desperdício na nuvem, você pode visitar a categoria Dicas.

Go up