Você pode controlar o navegador com Fara sete bilhões e manter seus dados no seu computador
5 meses ago · Updated 5 meses ago

Ouça este artigo
Você quer que uma IA cuide de buscas, reservas e formulários no seu computador sem mandar tudo para a nuvem? A Microsoft Research lançou Fara, um modelo com sete bilhões de parâmetros pensado para usar a interface por você. Ele lê capturas de tela, decide e executa ações como clicar, rolar e digitar. Roda no seu dispositivo, o que reduz latência e mantém sua navegação local. Foi treinado com um gerador de dados sintéticos chamado FaraGen e foca em eficiência. É de código aberto sob licença MIT, mas ainda é experimental, então teste em ambiente seguro e evite dados sensíveis.
- Modelo pequeno que roda no dispositivo para manter dados privados
- Interage com a tela e emite cliques, rolagem e digitação
- Evita depender de servidores ao executar tarefas web localmente
- Treinado com trajetórias sintéticas que simulam ações reais
- Mais eficiente que sistemas grandes e inclui salvaguardas
Microsoft lança Fara‑7B, modelo que age diretamente no seu computador
Você já pode executar um agente de IA que manipula a interface do seu navegador sem enviar tudo para a nuvem. A Microsoft Research apresentou o Fara‑7B, um modelo de 7 bilhões de parâmetros projetado para controlar o computador: ele lê capturas de tela, decide ações e emite cliques, digitação e buscas. Segundo a Microsoft, o objetivo é reduzir latência e manter seus dados de navegação locais — uma tendência que acompanha lançamentos de modelos que podem ser usados no seu computador ou celular.
O que é Fara‑7B
- Fara‑7B é um agente multimodal do tipo decoder-only.
- Ele recebe sua meta, capturas de tela e histórico de ações.
- Primeiro gera um raciocínio interno, depois emite uma chamada de ferramenta com argumentos como coordenadas e texto.
- O modelo foi treinado sobre várias fontes e é baseado em Qwen2.5‑VL‑7B, segundo os pesquisadores.
Como os dados foram gerados: FaraGen
A grande barreira para esse tipo de agente é a falta de dados reais. A Microsoft criou o FaraGen, um gerador de dados sintéticos, para simular interações web realistas — uma abordagem próxima ao que desenvolvedores usam quando treinam modelos open‑source para operar interfaces gráficas. O processo tem três etapas:
- Proposta de tarefas
- URLs iniciais são extraídas de corpora públicos.
- Modelos criam tarefas possíveis para cada página, sem exigir login ou pagamento.
- Resolução de tarefas
- Um sistema multiagente simula planejamento, navegação e instruções do usuário.
- A execução usa um controlador que emula cliques, digitação, rolagem e pesquisas.
- Verificação de trajetórias
- Três verificadores baseados em LLMs checam alinhamento com a tarefa, completude por rubricas e evidência visual.
- Segundo o relatório, os verificadores concordam com rótulos humanos em cerca de 83,3% dos casos.
Após filtragem, o pipeline produziu 145.603 trajetórias com 1.010.797 passos em 70.117 domínios. A média é 6,9 passos por tarefa. A Microsoft informa que gerar cada trajetória verificada com modelos premium custa perto de US$1.
Arquitetura e funcionamento técnico
- Contexto de até 128.000 tokens.
- Saída inclui cadeia de pensamento seguida por uma ação.
- O espaço de ferramentas cobre: clique, mover mouse, digitar, scroll, visitar URL, pesquisa web, voltar, pausar/memorizar, aguardar e terminar.
- O modelo prevê coordenadas em pixels para clicar diretamente na imagem, o que permite operar sem acessar a árvore de acessibilidade em tempo de execução.
- Treinamento via fine‑tuning supervisionado com cerca de 1,8 milhão de amostras que combinam trajetórias do FaraGen, tarefas de localização em UI, VQA com screenshots, legendagem e dados de segurança/recusa.
Desempenho e custos
A Microsoft avaliou Fara‑7B em quatro benchmarks ao vivo. Resultados reportados:
| Benchmark | Fara‑7B | Baseline 7B |
|---|---|---|
| WebVoyager | 73,5% | 66,4% |
| Online‑Mind2Web | 34,1% | 31,3% |
| DeepShop | 26,2% | 11,6% |
| WebTailBench (novo) | 38,4% | 19,5% |
- Em WebVoyager, cada tarefa usou em média 124.000 tokens de entrada, 1.100 tokens de saída e 16,5 ações.
- A estimativa de custo por tarefa é US$0,025 para Fara‑7B, comparada a cerca de US$0,30 para agentes do tipo SoM que dependem de modelos proprietários maiores.
- Pesquisadores afirmam que o modelo compete bem com sistemas maiores em várias tarefas, mantendo menor custo de inferência.
Disponibilidade, riscos e recomendações
- Fara‑7B foi disponibilizado sob licença MIT em plataformas públicas, como Microsoft Foundry e Hugging Face. Você pode consultar detalhes e baixar o modelo a partir de links oficiais; para mais contexto técnico e cobertura de imprensa veja também https://www.marktechpost.com/2025/11/24/microsoft-ai-releases-fara-7b-an-efficient-agentic-model-for-computer-use/.
- A Microsoft recomenda que você execute o modelo em ambientes isolados — práticas próximas às de integração e implantação que descrevem como integrar IA a recursos e ferramentas em tempo real.
- O projeto ainda é experimental. Evite usar o agente com dados sensíveis ou em cenários de alto risco.
- O sistema inclui salvaguardas para recusa e pontos críticos, segundo o relatório.
Conclusão
Você acabou de conhecer o Fara‑7B: um agente que pode agir diretamente no seu computador, com 7 bilhões de parâmetros, rodando de forma local para reduzir latência e proteger a privacidade. É eficiente, open‑source (MIT) e treinado com dados sintéticos gerados pelo FaraGen — um verdadeiro canivete suíço para automação de tarefas na interface. A proposta dialoga com outras iniciativas de agentes locais e offline, como projetos que mostram como criar agentes offline capazes de planejar e recuperar erros e runtimes que permitem publicar agentes na borda (modelos de visão e linguagem para dispositivos de borda).
Apesar do brilho, há um aviso claro: o projeto é experimental. Não entregue senhas ou informações sensíveis. Teste em sandbox, limite permissões e mantenha supervisão humana. Pense nele como um ajudante rápido e discreto — útil, porém ainda em treinamento.
Se você quer produtividade com cautela, o Fara‑7B merece um lugar nos seus testes. Consulte a cobertura técnica e referências adicionais em https://www.marktechpost.com/2025/11/24/microsoft-ai-releases-fara-7b-an-efficient-agentic-model-for-computer-use/ e monitore atualizações nos repositórios oficiais antes de implantar em produção. Para acompanhar práticas de implantação e ecossistemas de agentes, veja também o conteúdo sobre servidores MCP de código aberto.
Leia mais artigos e atualizações em https://blog.aidirectory.com.br.
Perguntas frequentes
- O que é o Fara‑7B e para que serve?
É um modelo multimodal de 7 bilhões de parâmetros. Ele vê screenshots e emite ações do tipo clicar, digitar e rolar. Foi feito para controlar navegadores e completar tarefas no computador.
- Posso rodar o Fara‑7B no meu próprio computador e manter os dados locais?
Sim. Ele é pequeno o bastante para rodar localmente em máquinas poderosas; rodando localmente, seus dados ficam no seu dispositivo em vez de irem para a nuvem. Para opções de hardware e runtimes voltados à privacidade e baixo consumo, confira soluções NPU e runtimes para dispositivos.
- Como o modelo realmente controla o navegador?
Recebe imagens da tela e histórico de ações. Gera pensamentos curtos e depois uma chamada de ferramenta com coordenadas, texto ou URLs. Ações incluem clicks, type, scroll, visiturl e websearch — um fluxo semelhante ao descrito em posts sobre como construir agentes que usam várias ferramentas.
- É seguro usar o agente para logins, compras ou dados sensíveis?
Não é recomendado. Evite senhas, bancos e dados sensíveis. Use sandbox, limite permissões e supervisão humana. O modelo tem recusas, mas não é infalível.
- Como reduzir riscos e garantir privacidade ao usar o Fara‑7B?
Rode em ambiente isolado. Dê só as permissões necessárias. Monitore ações em tempo real. Revise logs e peça confirmação humana antes de operações críticas. Para estratégias de proteção de dados e privacidade diferencial, veja também modelos que protegem dados com privacidade diferencial.
Se você quiser conhecer outros artigos semelhantes a Você pode controlar o navegador com Fara sete bilhões e manter seus dados no seu computador, você pode visitar a categoria Notícias e Tendências.
