Ornold
Voltar ao blog
Explicação4 min de leitura

O que o MCP muda para a automação de navegadores com IA

O MCP oferece aos agentes uma camada estruturada de ferramentas. Isso permite que Claude Code, Codex, Cursor e outros controlem navegadores reais com uma semântica comum.
20 de mar. de 2026

O problema antes do MCP

Antes do MCP, conectar um agente de IA a ferramentas externas significava integrações personalizadas para cada combinação. Quer que Claude Code controle um navegador? Escreva um plugin. Quer que Cursor faça a mesma coisa? Escreva um plugin diferente. Cada agente de IA tinha seu próprio formato de extensão, sua própria superfície de API e sua própria forma de descobrir ferramentas.
Para automação de navegador especificamente, isso significava construir e manter integrações separadas para cada agente de IA — embora os comandos de navegador subjacentes (navigate, click, fill, screenshot) sejam idênticos.

O que MCP realmente é

MCP (Model Context Protocol) é um padrão que define como agentes de IA descobrem e usam ferramentas externas. Pense nisso como uma porta USB-C para IA: um conector, muitos dispositivos. Um servidor MCP expõe um conjunto de ferramentas com entradas e saídas tipadas. Qualquer agente de IA compatível com MCP pode se conectar a ele e usar essas ferramentas imediatamente.
O protocolo define três coisas:
  • Descoberta de ferramentas — O agente pergunta "quais ferramentas você tem?" e obtém uma lista com nomes, descrições e esquemas de parâmetros.
  • Execução de ferramentas — O agente chama uma ferramenta com parâmetros específicos e obtém um resultado estruturado.
  • Transporte — Como o agente e o servidor se comunicam. Geralmente stdio (processo local) ou HTTP (servidor remoto).
// O servidor MCP expõe ferramentas assim: { "name": "browser_parallel_navigate", "description": "Navigate all active browser sessions to a URL", "parameters": { "url": { "type": "string", "description": "Target URL" } } } // O agente de IA o chama como qualquer outra ferramenta: > "Open google.com in all browsers" // O agente mapeia automaticamente para: browser_parallel_navigate({ url: "https://google.com" })

Por que isso importa para automação de navegador

A automação de navegador através do MCP muda fundamentalmente o modelo de interação. Em vez de escrever scripts que quebram quando as páginas mudam, você descreve o que quer em linguagem natural e o agente de IA descobre quais ferramentas usar.
Isso funciona porque MCP fornece ao agente contratos de ferramentas estruturados:
  • O agente sabe exatamente o que cada ferramenta faz, quais parâmetros ela aceita e o que retorna
  • As descrições de ferramentas ajudam o agente a escolher a ferramenta certa para cada situação
  • Os parâmetros tipados impedem solicitações malformadas
  • As respostas estruturadas permitem que o agente raciocine sobre os resultados e decida os próximos passos
Compare isso com automação baseada em prompts onde você cola um script Playwright no ChatGPT e espera que funcione. As ferramentas MCP são determinísticas — `browser_parallel_click({ ref: "submit" })` sempre clica no botão enviar. A IA cuida do planejamento; as ferramentas cuidam da execução.

Um servidor, muitos agentes

O maior benefício prático do MCP é escrever uma vez, usar em qualquer lugar. Ornold MCP expõe 40+ ferramentas de automação de navegador através de um único servidor. Qualquer agente compatível com MCP pode usá-las:
  • Claude Code — Agente de IA baseado em terminal da Anthropic
  • Codex — Agente de codificação da OpenAI (CLI e aplicativo de desktop)
  • Cursor — Editor de código alimentado por IA
  • Windsurf — IDE de IA da Codeium
  • Cline — Assistente de codificação de IA de código aberto para VS Code
  • VS Code Copilot — Assistente de IA do GitHub com suporte MCP
A configuração é quase idêntica para cada agente — instale o servidor MCP, forneça seu token, e o agente obtém acesso a todas as ferramentas do navegador. Nenhum plugin ou extensão específico do agente é necessário.
// A mesma configuração do servidor MCP funciona em todos os agentes: { "mcpServers": { "ornold-browser": { "command": "npx", "args": ["ornold-mcp", "--token", "YOUR_TOKEN", "--linken-port", "40080"] } } }
O formato de configuração varia ligeiramente entre agentes (JSON para Claude Code, TOML para Codex, JSON para Cursor), mas o comando do servidor MCP e os argumentos são sempre os mesmos.

Como MCP habilita planejamento e tentativas

Como as ferramentas MCP têm entradas e saídas estruturadas, os agentes de IA podem planejar fluxos de trabalho de várias etapas e lidar com falhas de forma inteligente. O agente não apenas executa um script fixo — ele observa resultados e se adapta.
Exemplo: o agente navega para uma página de inscrição, preenche o formulário e encontra um CAPTCHA. Sem MCP, um script falharia ou precisaria de um manipulador CAPTCHA codificado. Com MCP, o agente:
  • Vê o CAPTCHA no snapshot da página ou captura de tela
  • Reconhece que precisa da ferramenta `browser_solve_captcha`
  • Chama o solucionador e aguarda o resultado
  • Verifica se a solução foi bem-sucedida
  • Tenta novamente se necessário, ou continua com o envio do formulário
Esse comportamento adaptativo vem da combinação de ferramentas estruturadas (MCP) e raciocínio do modelo de linguagem. O agente entende o que cada ferramenta faz e pode encadeá-las com base no que observa.

MCP vs estruturas de automação de navegador

MCP não substitui Playwright, Puppeteer ou Selenium. Ele fica acima deles. Ornold usa CDP (Chrome DevTools Protocol) sob o capô — o mesmo protocolo que Playwright e Puppeteer usam. A diferença está em quem escreve a lógica de automação.
  • Playwright/Puppeteer — Você escreve o script. Você lida com seletores, esperas, tentativas e casos de erro. O script é determinístico mas frágil.
  • MCP + agente de IA — A IA escreve a lógica em tempo real. Você descreve o objetivo em linguagem natural. O agente escolhe ferramentas, lida com erros e se adapta às mudanças de página. Mais resiliente mas menos previsível.
Para fluxos de trabalho anti-detecção onde as páginas variam entre perfis e sessões, a abordagem adaptativa geralmente vence. Você não precisa antecipar cada estado de página possível — a IA lida com divergências naturalmente.

Começando

Configurar automação de navegador MCP leva cerca de 5 minutos:
  • Instale Node.js 20+ se você não tiver
  • Crie uma conta em mcp.ornold.com e obtenha um token de API
  • Adicione o servidor Ornold MCP à configuração do seu agente de IA
  • Inicie seu navegador anti-detecção e converse com a IA
Para instruções de configuração detalhadas, consulte os guias específicos do agente:

Posts relacionados