DS STAR do Google mostra como você pode transformar dados bagunçados em código Python pronto para análise

Neste artigo:

Ouça este artigo
Google apresenta DS STAR, sistema multiagente que transforma sua pergunta em Python rodável sobre arquivos mistos
O que é o DS STAR
Principais componentes do sistema
Como o sistema opera (etapas principais)
Resultados em benchmarks
Contexto e importância
Limitações e práticas observadas
Conclusão
Perguntas frequentes
Leitura adicional / Referências

Ouça este artigo

Você vai ver como o DS STAR transforma perguntas vagas sobre pastas bagunçadas de CSV, JSON e texto em código Python executável. O sistema usa agentes como Aanalyzer, Aplanner, Adebugger e Retriever para resumir arquivos, planejar passos, gerar código e corrigir erros de forma iterativa. Opera direto no seu lago de dados misto e alcança resultados fortes em benchmarks como DABStep, KramaBench e DA Code, rodando com um modelo grande tipo Gemini Pro. Leia também a cobertura técnica em https://www.marktechpost.com/2025/11/06/google-ai-introduces-ds-star-a-multi-agent-data-science-system-that-plans-codes-and-verifies-end-to-end-analytics/ para detalhes adicionais.

DS STAR transforma perguntas vagas em código Python que roda direto em arquivos mistos

Analisa cada arquivo e cria resumos que servem de contexto para o processo

Ciclo iterativo planeja, escreve e verifica código até a solução ficar correta

Módulos de depuração e recuperação acham arquivos relevantes e consertam erros de esquema

Resultados mostram ganho claro sobre agentes anteriores em tarefas de análise de dados

Google apresenta DS STAR, sistema multiagente que transforma sua pergunta em Python rodável sobre arquivos mistos

Você agora tem uma forma automática de converter questões de análise de dados em código Python executável que opera diretamente em pastas com CSV, JSON, texto e outros formatos. Pesquisadores do Google relatam que o novo sistema, chamado DS STAR, planeja, gera e verifica soluções em várias etapas e melhora resultados em benchmarks públicos. Veja também a análise técnica em https://www.marktechpost.com/2025/11/06/google-ai-introduces-ds-star-a-multi-agent-data-science-system-that-plans-codes-and-verifies-end-to-end-analytics/ para contexto adicional.

O que é o DS STAR

DS STAR é um framework multiagente que trata tarefas de análise como Text to Python, sem exigir um banco de dados relacional limpo.

O sistema cria descrições de cada arquivo no seu repositório e usa esse contexto para escrever, testar e corrigir scripts.

O objetivo é entregar respostas em formatos estritos e reproduzíveis, conforme exigido por benchmarks como DABStep, KramaBench e DA Code.

Principais componentes do sistema

Aanalyzer: analisa cada arquivo e produz um resumo com colunas, tipos e trechos de texto.

Retriever: seleciona os arquivos mais relevantes quando há muitos candidatos; para isso depende de embeddings e estratégias de recuperação semelhantes às descritas em artigos sobre uso de embeddings.

Aplanner: define o próximo passo de análise com base no resultado anterior.

Adebugger: corrige scripts falhos usando o erro, o código e os resumos de arquivos.

Averifier: avalia se a solução final cumpre as regras do problema.

Afinallyzer: gera o código final que aplica formatação, arredondamento e saída em CSV.

Como o sistema opera (etapas principais)

Varredura de arquivos: para cada arquivo Dᵢ, o Aanalyzer cria um script que extrai metadados e amostras; o output vira uma descrição dᵢ.

Recuperação: quando há muitos arquivos, o Retriever usa embeddings para achar os 100 mais relevantes — um fluxo semelhante ao de sistemas RAG com roteamento e verificação automatizada, como em guias sobre sistemas RAG.

Loop iterativo: o agente planeja, codifica, executa e verifica. Cada iteração responde ao resultado anterior. O ciclo para se o Averifier aprovar ou após 20 tentativas.

Depuração e finalização: se o código falhar, o Adebugger corrige com base no traceback e nas descrições; o Afinallyzer produz o código final conforme as regras.

Resultados em benchmarks

Benchmark	Sistema base / melhor alternativa	DS STAR (com Gemini 2.5 Pro)	Melhoria relatada
DABStep (hard)	Modelo sozinho: 12.70%	45.24% (hard) / 87.50% (easy)	Ganho absoluto > 32 pp no hard
DABStep (overall)	Melhor alternativa: 41.0%	45.2%	4.2 pp
KramaBench (normalizado)	Melhor alternativa: 39.8%	44.7%	4.9 pp
KramaBench (com recuperação)	DA Agent: 39.79	44.69	4.90 pontos
DA Code (overall)	Melhor alternativa: 37.0%	38.5%	1.5 pp
DA Code (hard)	DA Agent: 32.0%	37.1%	5.1 pp

Os experimentos principais usaram Gemini 2.5 Pro como modelo de linguagem e permitiram até 20 rodadas de refinamento por tarefa, segundo os relatórios da equipe. Para quem precisa integrar o modelo em pipelines de execução, há práticas recomendadas sobre uso do Gemini via CLI em CI/CD.

Contexto e importância

Sistemas atuais costumam assumir bancos de dados relacionais e usar Text-to-SQL, o que funciona pouco em ambientes onde os dados estão espalhados em planilhas, logs e documentos.

DS STAR muda essa suposição: traz uma estrutura explícita ao redor do modelo de linguagem, combinando análise de arquivos, recuperação de contexto e depuração automatizada — uma abordagem alinhada a trabalhos sobre como coordenar agentes e integrá‑los em interfaces e aplicações (integração de agentes em UI e coordenação MCP).

Para quem trabalha com dados, isso significa menos necessidade de um analista humano para transformar dados mistos em código reutilizável e respostas formatadas — algo que outras soluções de agentes para análise também buscam, como o WrenAI.

Limitações e práticas observadas

O sistema depende de bons embeddings para recuperação de arquivos relevantes.

A pipeline pode exigir várias iterações para lidar com deriva de esquema e colunas faltantes.

A pesquisa mostra ganhos, mas nem todas as métricas tiveram aumentos grandes; alguns avanços são modestos.

Conclusão

Você viu como o DS STAR transforma perguntas vagas em código Python executável que roda direto sobre pastas com CSV, JSON e texto, orquestrando agentes — Aanalyzer, Retriever, Aplanner, Adebugger, Averifier, Afinallyzer — para analisar, planejar, codar e consertar até chegar ao resultado. O ciclo iterativo traz ganhos reais em benchmarks como DABStep, KramaBench e DA Code, especialmente com modelos fortes como Gemini 2.5 Pro, e reduz o trabalho manual na preparação de dados mistos. Não é mágica — depende de embeddings e múltiplas tentativas — mas representa um avanço prático. Para uma leitura complementar e cobertura técnica, consulte também https://www.marktechpost.com/2025/11/06/google-ai-introduces-ds-star-a-multi-agent-data-science-system-that-plans-codes-and-verifies-end-to-end-analytics/.

Perguntas frequentes

O que é o DS STAR e o que ele faz?
É um sistema multiagente do Google que converte perguntas em código Python pronto para análise. Opera direto em CSV, JSON, texto e pastas bagunçadas.

Como ele transforma dados bagunçados em código executável?
Primeiro analisa cada arquivo com o Aanalyzer e cria resumos. Depois planeja, escreve, executa e corrige o código em ciclos, usando verificadores e um debugger automático.

Como ele encontra os arquivos relevantes num lago de dados gigante?
Cria embeddings dos resumos de arquivo e usa um retriever para selecionar os top 100 mais parecidos com a pergunta, reduzindo o ruído.

O que faz o Adebugger e por que é útil?
Quando o código quebra, o Adebugger recebe o script, o erro e os resumos dos arquivos e gera uma versão corrigida, resolvendo erros relacionados a colunas ou esquema.

Quais ganhos práticos o DS STAR mostrou nos benchmarks?
Melhora significativa na precisão: por exemplo, no DABStep (hard) passou de ~12,7% para 45,24% em tarefas difíceis; também subiu em KramaBench e DA Code frente a outros agentes.

Leitura adicional / Referências

Cobertura técnica: https://www.marktechpost.com/2025/11/06/google-ai-introduces-ds-star-a-multi-agent-data-science-system-that-plans-codes-and-verifies-end-to-end-analytics/

Post sobre DS STAR e automação de análises: Conheça o DS STAR

Para explorar mais sobre automação em data science, visite o blog da AIDirectory.

🤖 Encontre as Melhores Ferramentas de IA

Ouça este artigo

🤖 Encontre as Melhores Ferramentas de IA

Google apresenta DS STAR, sistema multiagente que transforma sua pergunta em Python rodável sobre arquivos mistos

O que é o DS STAR

Principais componentes do sistema

Como o sistema opera (etapas principais)

Resultados em benchmarks

Contexto e importância

Limitações e práticas observadas

Conclusão

Perguntas frequentes

Leitura adicional / Referências

🤖 Encontre as Melhores Ferramentas de IA

Você também pode gostar