Você pode controlar o navegador com Fara sete bilhões e manter seus dados no seu computador

5 meses ago · Updated 5 meses ago

voce-pode-controlar-o-navegador-com-fara-sete-bilhoes-e-manter-seus-dados-no-seu-computador
Table
  1. Ouça este artigo
  2. Microsoft lança Fara‑7B, modelo que age diretamente no seu computador
  3. O que é Fara‑7B
  4. Como os dados foram gerados: FaraGen
  5. Arquitetura e funcionamento técnico
  6. Desempenho e custos
  7. Disponibilidade, riscos e recomendações
  8. Conclusão
  9. Perguntas frequentes

Ouça este artigo


Você quer que uma IA cuide de buscas, reservas e formulários no seu computador sem mandar tudo para a nuvem? A Microsoft Research lançou Fara, um modelo com sete bilhões de parâmetros pensado para usar a interface por você. Ele lê capturas de tela, decide e executa ações como clicar, rolar e digitar. Roda no seu dispositivo, o que reduz latência e mantém sua navegação local. Foi treinado com um gerador de dados sintéticos chamado FaraGen e foca em eficiência. É de código aberto sob licença MIT, mas ainda é experimental, então teste em ambiente seguro e evite dados sensíveis.

  • Modelo pequeno que roda no dispositivo para manter dados privados
  • Interage com a tela e emite cliques, rolagem e digitação
  • Evita depender de servidores ao executar tarefas web localmente
  • Treinado com trajetórias sintéticas que simulam ações reais
  • Mais eficiente que sistemas grandes e inclui salvaguardas

Microsoft lança Fara‑7B, modelo que age diretamente no seu computador

Você já pode executar um agente de IA que manipula a interface do seu navegador sem enviar tudo para a nuvem. A Microsoft Research apresentou o Fara‑7B, um modelo de 7 bilhões de parâmetros projetado para controlar o computador: ele lê capturas de tela, decide ações e emite cliques, digitação e buscas. Segundo a Microsoft, o objetivo é reduzir latência e manter seus dados de navegação locais — uma tendência que acompanha lançamentos de modelos que podem ser usados no seu computador ou celular.

O que é Fara‑7B

  • Fara‑7B é um agente multimodal do tipo decoder-only.
  • Ele recebe sua meta, capturas de tela e histórico de ações.
  • Primeiro gera um raciocínio interno, depois emite uma chamada de ferramenta com argumentos como coordenadas e texto.
  • O modelo foi treinado sobre várias fontes e é baseado em Qwen2.5‑VL‑7B, segundo os pesquisadores.

Como os dados foram gerados: FaraGen

A grande barreira para esse tipo de agente é a falta de dados reais. A Microsoft criou o FaraGen, um gerador de dados sintéticos, para simular interações web realistas — uma abordagem próxima ao que desenvolvedores usam quando treinam modelos open‑source para operar interfaces gráficas. O processo tem três etapas:

  • Proposta de tarefas
  • URLs iniciais são extraídas de corpora públicos.
  • Modelos criam tarefas possíveis para cada página, sem exigir login ou pagamento.
  • Resolução de tarefas
  • Um sistema multiagente simula planejamento, navegação e instruções do usuário.
  • A execução usa um controlador que emula cliques, digitação, rolagem e pesquisas.
  • Verificação de trajetórias
  • Três verificadores baseados em LLMs checam alinhamento com a tarefa, completude por rubricas e evidência visual.
  • Segundo o relatório, os verificadores concordam com rótulos humanos em cerca de 83,3% dos casos.

Após filtragem, o pipeline produziu 145.603 trajetórias com 1.010.797 passos em 70.117 domínios. A média é 6,9 passos por tarefa. A Microsoft informa que gerar cada trajetória verificada com modelos premium custa perto de US$1.

Arquitetura e funcionamento técnico

  • Contexto de até 128.000 tokens.
  • Saída inclui cadeia de pensamento seguida por uma ação.
  • O espaço de ferramentas cobre: clique, mover mouse, digitar, scroll, visitar URL, pesquisa web, voltar, pausar/memorizar, aguardar e terminar.
  • O modelo prevê coordenadas em pixels para clicar diretamente na imagem, o que permite operar sem acessar a árvore de acessibilidade em tempo de execução.
  • Treinamento via fine‑tuning supervisionado com cerca de 1,8 milhão de amostras que combinam trajetórias do FaraGen, tarefas de localização em UI, VQA com screenshots, legendagem e dados de segurança/recusa.

Desempenho e custos

A Microsoft avaliou Fara‑7B em quatro benchmarks ao vivo. Resultados reportados:

Benchmark Fara‑7B Baseline 7B
WebVoyager 73,5% 66,4%
Online‑Mind2Web 34,1% 31,3%
DeepShop 26,2% 11,6%
WebTailBench (novo) 38,4% 19,5%
  • Em WebVoyager, cada tarefa usou em média 124.000 tokens de entrada, 1.100 tokens de saída e 16,5 ações.
  • A estimativa de custo por tarefa é US$0,025 para Fara‑7B, comparada a cerca de US$0,30 para agentes do tipo SoM que dependem de modelos proprietários maiores.
  • Pesquisadores afirmam que o modelo compete bem com sistemas maiores em várias tarefas, mantendo menor custo de inferência.

Disponibilidade, riscos e recomendações

  • Fara‑7B foi disponibilizado sob licença MIT em plataformas públicas, como Microsoft Foundry e Hugging Face. Você pode consultar detalhes e baixar o modelo a partir de links oficiais; para mais contexto técnico e cobertura de imprensa veja também https://www.marktechpost.com/2025/11/24/microsoft-ai-releases-fara-7b-an-efficient-agentic-model-for-computer-use/.
  • O projeto ainda é experimental. Evite usar o agente com dados sensíveis ou em cenários de alto risco.
  • O sistema inclui salvaguardas para recusa e pontos críticos, segundo o relatório.

Conclusão

Você acabou de conhecer o Fara‑7B: um agente que pode agir diretamente no seu computador, com 7 bilhões de parâmetros, rodando de forma local para reduzir latência e proteger a privacidade. É eficiente, open‑source (MIT) e treinado com dados sintéticos gerados pelo FaraGen — um verdadeiro canivete suíço para automação de tarefas na interface. A proposta dialoga com outras iniciativas de agentes locais e offline, como projetos que mostram como criar agentes offline capazes de planejar e recuperar erros e runtimes que permitem publicar agentes na borda (modelos de visão e linguagem para dispositivos de borda).

Apesar do brilho, há um aviso claro: o projeto é experimental. Não entregue senhas ou informações sensíveis. Teste em sandbox, limite permissões e mantenha supervisão humana. Pense nele como um ajudante rápido e discreto — útil, porém ainda em treinamento.

Se você quer produtividade com cautela, o Fara‑7B merece um lugar nos seus testes. Consulte a cobertura técnica e referências adicionais em https://www.marktechpost.com/2025/11/24/microsoft-ai-releases-fara-7b-an-efficient-agentic-model-for-computer-use/ e monitore atualizações nos repositórios oficiais antes de implantar em produção. Para acompanhar práticas de implantação e ecossistemas de agentes, veja também o conteúdo sobre servidores MCP de código aberto.

Leia mais artigos e atualizações em https://blog.aidirectory.com.br.


Perguntas frequentes

  • O que é o Fara‑7B e para que serve?
    É um modelo multimodal de 7 bilhões de parâmetros. Ele vê screenshots e emite ações do tipo clicar, digitar e rolar. Foi feito para controlar navegadores e completar tarefas no computador.
  • Posso rodar o Fara‑7B no meu próprio computador e manter os dados locais?
    Sim. Ele é pequeno o bastante para rodar localmente em máquinas poderosas; rodando localmente, seus dados ficam no seu dispositivo em vez de irem para a nuvem. Para opções de hardware e runtimes voltados à privacidade e baixo consumo, confira soluções NPU e runtimes para dispositivos.
  • Como o modelo realmente controla o navegador?
    Recebe imagens da tela e histórico de ações. Gera pensamentos curtos e depois uma chamada de ferramenta com coordenadas, texto ou URLs. Ações incluem clicks, type, scroll, visiturl e websearch — um fluxo semelhante ao descrito em posts sobre como construir agentes que usam várias ferramentas.
  • É seguro usar o agente para logins, compras ou dados sensíveis?
    Não é recomendado. Evite senhas, bancos e dados sensíveis. Use sandbox, limite permissões e supervisão humana. O modelo tem recusas, mas não é infalível.
  • Como reduzir riscos e garantir privacidade ao usar o Fara‑7B?
    Rode em ambiente isolado. Dê só as permissões necessárias. Monitore ações em tempo real. Revise logs e peça confirmação humana antes de operações críticas. Para estratégias de proteção de dados e privacidade diferencial, veja também modelos que protegem dados com privacidade diferencial.

Se você quiser conhecer outros artigos semelhantes a Você pode controlar o navegador com Fara sete bilhões e manter seus dados no seu computador, você pode visitar a categoria Notícias e Tendências.

Go up