Retour au blog
Explication4 min de lecture
Ce que MCP change pour l’automatisation de navigateur par IA
MCP fournit aux agents une couche d’outils structurée. Cela permet à Claude Code, Codex, Cursor et d’autres de piloter de vrais navigateurs avec une sémantique partagée.
20 mars 2026Le problème avant MCP
Avant MCP, connecter un agent IA à des outils externes signifiait des intégrations personnalisées pour chaque combinaison. Veux-tu que Claude Code contrôle un navigateur ? Écris un plugin. Veux-tu que Cursor fasse la même chose ? Écris un plugin différent. Chaque agent IA avait son propre format d’extension, sa propre surface API et sa propre façon de découvrir les outils.
Pour l’automatisation du navigateur spécifiquement, cela signifiait construire et maintenir des intégrations séparées pour chaque agent IA — bien que les commandes de navigateur sous-jacentes (navigate, click, fill, screenshot) soient identiques.
Ce qu’est réellement MCP
MCP (Model Context Protocol) est une norme qui définit comment les agents IA découvrent et utilisent les outils externes. Pense à cela comme un port USB-C pour l’IA : un connecteur, de nombreux appareils. Un serveur MCP expose un ensemble d’outils avec des entrées et des sorties typées. N’importe quel agent IA compatible avec MCP peut s’y connecter et utiliser ces outils immédiatement.
Le protocole définit trois choses :
- Découverte d’outils — L’agent demande « quels outils as-tu ? » et obtient une liste avec des noms, des descriptions et des schémas de paramètres.
- Exécution d’outils — L’agent appelle un outil avec des paramètres spécifiques et obtient un résultat structuré.
- Transport — Comment l’agent et le serveur communiquent. Généralement stdio (processus local) ou HTTP (serveur distant).
// Le serveur MCP expose les outils comme ceci :
{
"name": "browser_parallel_navigate",
"description": "Navigate all active browser sessions to a URL",
"parameters": {
"url": { "type": "string", "description": "Target URL" }
}
}
// L’agent IA l’appelle comme n’importe quel autre outil :
> "Open google.com in all browsers"
// L’agent le mappe automatiquement à :
browser_parallel_navigate({ url: "https://google.com" })
Pourquoi c’est important pour l’automatisation du navigateur
L’automatisation du navigateur via MCP change fondamentalement le modèle d’interaction. Au lieu d’écrire des scripts qui se cassent quand les pages changent, tu décris ce que tu veux en langage naturel et l’agent IA découvre quels outils utiliser.
Cela fonctionne parce que MCP fournit à l’agent des contrats d’outils structurés :
- L’agent sait exactement ce que fait chaque outil, quels paramètres il accepte et ce qu’il retourne
- Les descriptions d’outils aident l’agent à choisir le bon outil pour chaque situation
- Les paramètres typés empêchent les demandes mal formées
- Les réponses structurées permettent à l’agent de raisonner sur les résultats et de décider des prochaines étapes
Compare cela à l’automatisation basée sur des invites où tu colles un script Playwright dans ChatGPT et espères que cela fonctionne. Les outils MCP sont déterministes — `browser_parallel_click({ ref: "submit" })` clique toujours sur le bouton soumettre. L’IA gère la planification ; les outils gèrent l’exécution.
Un serveur, plusieurs agents
Le plus grand avantage pratique de MCP est d’écrire une fois, d’utiliser partout. Ornold MCP expose 40+ outils d’automatisation du navigateur via un seul serveur. N’importe quel agent compatible avec MCP peut les utiliser :
- Claude Code — Agent IA basé sur terminal d’Anthropic
- Codex — Agent de codage d’OpenAI (CLI et application de bureau)
- Cursor — Éditeur de code alimenté par l’IA
- Windsurf — IDE IA de Codeium
- Cline — Assistant de codage IA open-source pour VS Code
- VS Code Copilot — Assistant IA de GitHub avec support MCP
La configuration est presque identique pour chaque agent — installe le serveur MCP, fournis ton token, et l’agent obtient l’accès à tous les outils du navigateur. Aucun plugin ou extension spécifique à l’agent n’est nécessaire.
// La même configuration de serveur MCP fonctionne pour tous les agents :
{
"mcpServers": {
"ornold-browser": {
"command": "npx",
"args": ["ornold-mcp", "--token", "YOUR_TOKEN", "--linken-port", "40080"]
}
}
}
Le format de configuration varie légèrement entre les agents (JSON pour Claude Code, TOML pour Codex, JSON pour Cursor), mais la commande du serveur MCP et les arguments sont toujours les mêmes.
Comment MCP active la planification et les tentatives
Parce que les outils MCP ont des entrées et des sorties structurées, les agents IA peuvent planifier des flux de travail multi-étapes et gérer les défaillances de manière intelligente. L’agent n’exécute pas simplement un script fixe — il observe les résultats et s’adapte.
Exemple : l’agent accède à une page d’inscription, remplit le formulaire et rencontre un CAPTCHA. Sans MCP, un script s’arrêterait ou aurait besoin d’un gestionnaire CAPTCHA codé en dur. Avec MCP, l’agent :
- Voit le CAPTCHA dans l’instantané de la page ou la capture d’écran
- Reconnaît qu’il a besoin de l’outil `browser_solve_captcha`
- Appelle le solveur et attend le résultat
- Vérifie si la résolution a réussi
- Réessaie si nécessaire, ou continue la soumission du formulaire
Ce comportement adaptatif provient de la combinaison d’outils structurés (MCP) et du raisonnement du modèle de langage. L’agent comprend ce que fait chaque outil et peut les enchaîner en fonction de ce qu’il observe.
MCP vs cadres d’automatisation du navigateur
MCP ne remplace pas Playwright, Puppeteer ou Selenium. Il se situe au-dessus d’eux. Ornold utilise CDP (Chrome DevTools Protocol) sous le capot — le même protocole que Playwright et Puppeteer utilisent. La différence réside dans qui écrit la logique d’automatisation.
- Playwright/Puppeteer — Tu écris le script. Tu gères les sélecteurs, les attentes, les tentatives et les cas d’erreur. Le script est déterministe mais fragile.
- MCP + agent IA — L’IA écrit la logique à la volée. Tu décris l’objectif en langage naturel. L’agent choisit les outils, gère les erreurs et s’adapte aux changements de page. Plus résilient mais moins prévisible.
Pour les flux de travail anti-détection où les pages varient entre les profils et les sessions, l’approche adaptative gagne souvent. Tu n’as pas besoin d’anticiper chaque état de page possible — l’IA gère naturellement la divergence.
Commencer
La configuration de l’automatisation du navigateur MCP prend environ 5 minutes :
- Installe Node.js 20+ si tu ne l’as pas
- Crée un compte sur mcp.ornold.com et obtiens un token API
- Ajoute le serveur Ornold MCP à la configuration de ton agent IA
- Démarre ton navigateur anti-détection et parle à l’IA
Pour des instructions de configuration détaillées, consulte les guides spécifiques à l’agent :
- Claude Code + Ornold MCP — Guide de configuration complet pour Claude Code
- Codex + Ornold MCP — Guide de configuration pour OpenAI Codex CLI et application de bureau
- Dolphin Anty MCP Setup — Connexion à Dolphin Anty
- Linken Sphere MCP Setup — Connexion à Linken Sphere