Anthropic lança Claude Sonnet quatro ponto cinco e ajuda você a criar agentes e programar melhor
6 dias ago · Updated 6 dias ago

Ouça este artigo
Neste artigo você verá o que a Claude Sonnet trouxe de novo e por que isso importa para seu trabalho com código e agentes. A atualização foca em planejamento, memória e orquestração de ferramentas para tarefas longas. Também há mudanças práticas no produto — checkpoints no Claude Code, integração com VS Code e novas ferramentas de memória na API — e um Agent SDK que expõe o mesmo esqueleto que a Anthropic usa em produção. O texto explica onde rodar tudo, o que mudou e o impacto para sua equipe. Para referência técnica completa: https://www.marktechpost.com/2025/09/29/anthropic-launches-claude-sonnet-4-5-with-new-coding-and-agentic-state-of-the-art-results/
- Nova versão do Claude Sonnet foca em programação e agentes
- SDK de agentes traz memória, permissões e coordenação para tarefas longas
- Checkpoints, extensão para VS Code e terminal renovado para desenvolvimento
- Melhor em usar computador, preencher planilhas e navegar na web
- Projetado para automação real e cargas de trabalho de engenharia de software
Anthropic lança Claude Sonnet 4.5 com foco em agentes e uso real de computadores
Você precisa saber: a Anthropic anunciou o Claude Sonnet 4.5, direcionada a tarefas de engenharia de software ponta a ponta e automação que usa ferramentas reais. A atualização traz novas superfícies de produto, um Agent SDK que reproduz padrões de produção e manutenção de contexto, e preços mantidos em relação à versão anterior. Detalhes técnicos estão em: https://www.marktechpost.com/2025/09/29/anthropic-launches-claude-sonnet-4-5-with-new-coding-and-agentic-state-of-the-art-results/
O que há de novo
- Agent SDK: expõe a infraestrutura que a Anthropic usa internamente, com gerenciamento de memória para tarefas longas, controle de permissões e coordenação entre sub-agentes — permitindo replicar fluxos robustos. Para quem implementa sistemas coordenados, é útil comparar padrões com guias sobre como construir agentes MCP que coordenam em equipe e entendem contexto.
- Checkpoints no Claude Code: salvar e reverter estados em execuções longas de código — uma evolução na linha do que o Sonnet já vinha trazendo para desenvolvedores, com histórico e práticas documentadas em posts sobre o impacto do Sonnet no desenvolvimento de software.
- Integração nativa com VS Code: extensão conecta o modelo ao IDE para acelerar o desenvolvimento, seguindo tendências de integração do ecossistema de agentes e extensões IDE.
- Ferramentas de contexto/memória na API: melhorias para manter coerência em trabalhos que duram horas; para casos que exigem memória persistente, veja exemplos de implementações de memória em SQL em memória persistente.
- Terminal e demo em navegador: foco em navegar, preencher planilhas e completar fluxos web; esse tipo de integração com interfaces aparece também em soluções de UI para agentes em tempo real, como descrito em APIs de integração de agentes em tempo real.
- Disponibilidade: integrações relatadas com Copilot, Bedrock, Vertex e a API da Anthropic.
- Preço: mantido em US$3 por milhão de tokens de entrada e US$15 por milhão de tokens de saída, segundo a Anthropic.
Resultados e desempenho
A Anthropic divulgou ganhos em benchmarks voltados para uso de computador e engenharia de software, sugerindo menor necessidade de intervenção humana em execuções automatizadas.
Métrica | Resultado divulgado |
---|---|
SWE-bench Verified | 77.2% |
Ganho no OSWorld-Verified | 19 pontos |
Liderança em uso de computador (OSWorld-Verified) | 61.4% |
Esses testes medem navegação, edição de planilhas e orquestração de ferramentas em cenários que simulam uso de computador real. Para metodologias e novos critérios de avaliação de agentes, vale conferir o texto sobre o sistema de avaliação de agentes.
Para quem e onde rodar
- Quem deve avaliar: equipes que constroem agentes autônomos, RPA empresarial e pipelines de longa duração. A abordagem do Sonnet 4.5 casa com práticas de integração de agentes ao lado de serviços para reduzir tempo de resposta, discutidas em usar agentes ao lado dos seus serviços.
- Uso ideal: cenários que exigem planejamento estendido, memória duradoura e coordenação entre ferramentas.
- Onde rodar: API da Anthropic, integrações com provedores de nuvem e a extensão para VS Code.
Você pode aplicar as mesmas práticas de produção descritas pela Anthropic para manter tarefas multihorárias coerentes e reversíveis. Para quem monta pipelines de pesquisa e conteúdo que envolvem várias etapas automatizadas, os princípios são semelhantes aos descritos em guias sobre construção de pipelines de pesquisa e conteúdo. Mais informações técnicas e contexto de lançamento estão em https://www.marktechpost.com/2025/09/29/anthropic-launches-claude-sonnet-4-5-with-new-coding-and-agentic-state-of-the-art-results/
Contexto e implicações
- Desenvolvimento prioriza pontos frágeis dos agentes: planejamento prolongado, memória e orquestração de ferramentas.
- A Anthropic distribuiu scaffolding (padrões de infraestrutura) em vez de apenas um endpoint de modelo, facilitando replicar comportamentos de produção — uma abordagem que aproxima práticas de RAG nativo e RAG-agente, discutidas em RAG nativo vs RAG agente.
- Observadores e empresas em prova de conceito devem realizar validação independente para confirmar robustez em seus fluxos.
- A atualização indica uma mudança no setor: de respostas curtas a workflows autônomos e duradouros.
Conclusão
O Claude Sonnet 4.5 não é só uma versão incremental — é um movimento em direção à automação real e workflows autônomos. As ferramentas concretas — Agent SDK, memória duradoura, checkpoints no Claude Code e integração com VS Code — permitem que agentes planejem mais longe e peçam menos intervenção.
Na prática, isso significa menos correções manuais e mais processos coerentes por horas. Se você trabalha com RPA, pipelines longos ou agentes que interagem com o mundo real, vai sentir o impacto: menos quebra-cabeça e mais execução. Ainda assim, é necessário validar e ajustar para o seu contexto; o scaffolding que a Anthropic fornece torna repetir resultados mais viável. Para ver como práticas de implementação e memória persistente são adotadas por outras ferramentas, consulte exemplos de memória em agentes em SQL em GibsonAI Memori.
Quer se aprofundar? Leia a cobertura completa e técnica no link de referência: https://www.marktechpost.com/2025/09/29/anthropic-launches-claude-sonnet-4-5-with-new-coding-and-agentic-state-of-the-art-results/ — ou continue acompanhando artigos no blog AI Directory.
Perguntas frequentes
- O que há de novo no Claude Sonnet 4.5?
Sonnet 4.5 melhora uso de computadores: checkpoints no Claude Code, terminal renovado, integração com VS Code, melhor memória de contexto e ferramentas de API para trabalhos longos.
- Como isso ajuda a criar agentes?
O Agent SDK replica o scaffolding interno da Anthropic, oferecendo memória para tarefas longas, controle de permissões e coordenação entre sub-agentes, tornando agentes mais confiáveis e fáceis de manter. Para exemplos práticos de agentes coordenados, veja como equipes têm montado agentes MCP que trabalham em conjunto: construção de agentes MCP.
- Quais as melhorias práticas para programadores?
Código mais coerente em execuções longas, checkpoints para reverter passos, extensão VS Code e integrações com Copilot/Bedrock/Vertex que aceleram o fluxo.
- Onde e como posso rodar o Sonnet 4.5?
Via API Anthropic e integrações (VS Code, Copilot, Bedrock, Vertex). Pode rodar na nuvem da Anthropic ou em serviços parceiros. Preço: US$3 por milhão de tokens de entrada e US$15 por milhão de saída.
- Qual o desempenho em benchmarks e o que isso significa na prática?
Marcas como 77.2% no SWE-bench e 19 pontos no OSWorld-Verified (61.4% em uso de computador) indicam menos intervenções humanas em tarefas RPA e mais sucesso em fluxos reais. Para entender novos critérios de avaliação, consulte o artigo sobre o sistema de avaliação de agentes.
Se você quiser conhecer outros artigos semelhantes a Anthropic lança Claude Sonnet quatro ponto cinco e ajuda você a criar agentes e programar melhor, você pode visitar a categoria Notícias e Tendências.