Zurück zum Blog
Leitfaden14 Min. Lesezeit
Codex + Ornold MCP: Browser-Automatisierung einrichten
Codex CLI oder Desktop-App mit Ornold MCP verbinden. config.toml konfigurieren und Antidetect-Browser mit KI automatisieren.
17. Apr. 2026Was du aufbauen wirst
Am Ende dieser Anleitung hast du OpenAI Codex — sowohl die CLI als auch die Desktop-App — dabei, echte Antidetect-Browser-Sitzungen über Ornold MCP zu steuern. Seiten navigieren, Formulare ausfüllen, CAPTCHAs lösen und mehrere Profile verwalten — alles per natürlicher Sprache. Keine Skripte, keine Selektoren.
Diese Anleitung behandelt die Codex CLI (macOS, Windows, Linux) und die Codex Desktop-App (macOS Apple Silicon). Codex Cloud (ChatGPT Web) verwendet einen anderen Workflow und benötigt kein MCP — sie wird hier nicht behandelt.
Codex CLI vs. Codex App vs. Codex Cloud
OpenAI bietet Codex in drei Formen an. Hier ist, welche du benötigst:
- Codex CLI — Terminal-basierter Agent. Läuft lokal über den Befehl `codex`. Unterstützt MCP via config.toml. Funktioniert auf macOS, Windows und Linux.
- Codex App — Desktop-Anwendung für macOS (Apple Silicon). Visuelle Oberfläche mit derselben MCP-Unterstützung wie die CLI.
- Codex Cloud — Browser-basierter Agent innerhalb von ChatGPT. Verbindet sich direkt mit GitHub-Repos. Verwendet KEIN MCP — Aufgaben laufen in OpenAIs Cloud-Sandbox.
Diese Anleitung behandelt die CLI und die App. Beide verbinden sich mit Ornold MCP auf dieselbe Weise — über config.toml.
Voraussetzungen
- Ein Computer mit macOS 12+, Windows 10/11 oder Linux
- Ein OpenAI API-Schlüssel oder ein ChatGPT Plus/Pro/Team-Abonnement
- Ein installierter Antidetect-Browser: Linken Sphere, Dolphin Anty, Wadex oder Vision Browser
- Node.js 20+ installiert (siehe Schritt 1)
Schritt 1 — Node.js installieren
Ornold MCP läuft als Node.js-Paket. Du benötigst Node.js Version 20 oder höher.
macOS
Am einfachsten geht es mit Homebrew:
brew install node@22
Windows
Lade das LTS-Installationsprogramm von nodejs.org herunter (22.x). Starte es und stelle sicher, dass „Zu PATH hinzufügen" aktiviert ist.
Linux
# Ubuntu/Debian
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
sudo apt-get install -y nodejs
# Or use nvm
nvm install 22
Überprüfen:
node --version # v22.x.x or higher
npm --version # 10.x.x or higher
Schritt 2 — Codex installieren
Option A: Codex CLI
Installiere die Codex CLI global über npm:
npm install -g codex
Starte es zur Überprüfung und Authentifizierung:
codex
# Sign in with your OpenAI API key when prompted
Du kannst auch die Umgebungsvariable OPENAI_API_KEY setzen, anstatt dich interaktiv anzumelden.
Option B: Codex Desktop-App
Lade die Codex-App von openai.com/codex herunter (nur macOS Apple Silicon). Installiere sie, öffne sie und melde dich mit deinem ChatGPT-Konto oder OpenAI API-Schlüssel an. Wähle bei Aufforderung einen Projektordner aus.
Die Codex-App liest dieselbe config.toml wie die CLI, daher funktioniert das MCP-Setup für beide identisch.
Schritt 3 — Ornold-Konto erstellen
Ornold ist die Brücke zwischen KI-Agenten und Antidetect-Browsern.
- Gehe zu mcp.ornold.com
- Klicke auf „Registrieren" und erstelle ein Konto mit deiner E-Mail
- Bestätige deine E-Mail mit dem 6-stelligen Code
- Du landest auf dem Dashboard
Schritt 4 — API-Token erstellen
Erstelle im Dashboard deinen ersten API-Token:
- Gib einen Namen für deinen Token ein (z. B. „Codex")
- Klicke auf „Erstellen"
- Kopiere den Token — du brauchst ihn gleich
Kostenlose Konten erhalten 1 Sitzplatz, 5 CAPTCHA-Lösungen (nach der Dashboard-Tour) und Zugang zu Standard-Browsern.
Schritt 5 — MCP-Konfiguration mit dem Dashboard-Assistenten generieren
Das Ornold-Dashboard hat einen integrierten Verbindungsassistenten, der die exakte MCP-Konfiguration für dein Setup generiert. Keine manuelle Befehlserstellung nötig — wähle einfach deine Optionen und kopiere das Ergebnis.
Gehe zum Tab „API-Tokens" im Dashboard. Finde deinen Token und klicke auf die Schaltfläche „Verbinden" daneben.
Assistent Schritt 1 — Wähle deinen KI-Agenten
Der Assistent fragt, welchen KI-Agenten du verwendest. Wähle „Codex" aus der Liste. Der Assistent generiert die Konfiguration im TOML-Format (config.toml) statt JSON. Andere unterstützte Agenten sind Claude Code, Cursor, VS Code, Windsurf und Cline.
Assistent Schritt 2 — Wähle den Interaktionsmodus
Wähle, wie die KI mit Browser-Seiten interagieren soll:
- DOM-Modus (Standard) — Die KI liest die HTML-Struktur der Seite. Jedes Element erhält einen [ref=N]-Marker. Kostenlos und schnell. Am besten für Formulare, strukturierte Seiten und Standard-Websites.
- Vision AI-Modus — Die KI macht einen Screenshot und findet Elemente visuell nach ihrem Aussehen. Funktioniert auf jeder Seite, sogar bei Canvas-basierten UIs. Jede Analyse kostet 1 Vision-Kredit.
- Beide Modi — Alle Tools verfügbar. Die KI wählt automatisch den besten Ansatz für jede Aktion.
Beginne mit dem DOM-Modus. Er ist kostenlos, schnell und deckt 90 % der Anwendungsfälle ab. Du kannst später jederzeit zu „Beide" wechseln, wenn du visuelle Analyse benötigst.
Assistent Schritt 3 — Antidetect-Browser aktivieren
Aktiviere die Browser, die du verwendest, und fülle ihre Verbindungsdetails aus:
- Linken Sphere — Setze nur den API-Port (Standard: 40080). Stelle sicher, dass Sphere läuft.
- Dolphin Anty — Setze den lokalen Port (Standard: 3001) und füge dein Dolphin API-Token aus Einstellungen → API ein.
- Wadex — Setze den API-Port (Standard: 8080).
- Vision Browser — Füge dein X-Token ein. Optional einen lokalen Port setzen.
Du kannst mehrere Browser gleichzeitig aktivieren. Die MCP-Konfiguration wird alle enthalten, und der KI-Agent kann jeden steuern, der läuft.
Assistent Schritt 4 — Kopiere die Konfiguration
Der Assistent generiert die finale Konfiguration basierend auf deinen Auswahlen. Für Codex erhältst du einen fertigen TOML-Block für config.toml. Klicke auf „Kopieren", um ihn zu übernehmen.
Der Assistent füllt dein tatsächliches Token und die Port-Werte bereits aus — klicke einfach auf „Kopieren" und füge es in config.toml ein. Keine manuelle Bearbeitung nötig.
Schritt 6 — Ornold MCP zu Codex hinzufügen
Du hast zwei Möglichkeiten, den MCP-Server hinzuzufügen — über die Codex App GUI oder durch manuelles Bearbeiten von config.toml. Beide Methoden liefern dasselbe Ergebnis.
Option A: Über die Codex App-Oberfläche (empfohlen)
Wenn du die Codex Desktop-App verwendest, kannst du MCP-Server direkt über die Einstellungs-UI hinzufügen — kein Bearbeiten von Dateien nötig.
- Öffne die Codex-App und klicke auf das Zahnrad-Symbol (⚙️) oben rechts
- Gehe zum Bereich Integrations & MCP
- Klicke auf „Add Server" oder „Add Custom Server"
Fülle im Server-Konfigurationsformular folgendes aus:
- Server name: ornold-browser
- Transport: stdio
- Command: npx
- Arguments: ornold-mcp --token YOUR_TOKEN --linken-port 40080 (anpassen für deinen Browser)
Klicke auf „Save" oder „Add". Der Ornold MCP-Server erscheint in deiner Server-Liste. Codex lädt ihn automatisch bei der nächsten Sitzung.
Die Einstellungen werden intern in config.toml gespeichert, sodass sie automatisch zwischen der Codex App, CLI und IDE-Erweiterung synchronisiert werden.
Option B: config.toml manuell bearbeiten (CLI-Nutzer)
Wenn du die CLI bevorzugst oder Codex auf einem Headless-Server einrichten möchtest, bearbeite die Konfigurationsdatei direkt:
# macOS / Linux
~/.codex/config.toml
# Windows
%USERPROFILE%\.codex\config.toml
Füge den MCP-Server-Block aus dem Assistenten ein. So sieht er für Linken Sphere aus:
# ~/.codex/config.toml
[mcp_servers.ornold-browser]
command = "npx"
args = ["ornold-mcp", "--token", "YOUR_TOKEN", "--linken-port", "40080"]
Für Dolphin Anty enthalten die Args den Dolphin-Token:
[mcp_servers.ornold-browser]
command = "npx"
args = ["ornold-mcp", "--token", "YOUR_TOKEN", "--dolphin-port", "3001", "--dolphin-token", "YOUR_DOLPHIN_TOKEN"]
Für mehrere Browser gleichzeitig:
[mcp_servers.ornold-browser]
command = "npx"
args = ["ornold-mcp", "--token", "YOUR_TOKEN", "--linken-port", "40080", "--dolphin-port", "3001", "--dolphin-token", "DOLPHIN_KEY", "--wadex-port", "8080"]
Option C: One-liner über CLI
Du kannst den Server auch mit einem einzigen Terminal-Befehl hinzufügen:
codex mcp add ornold-browser -- npx ornold-mcp --token YOUR_TOKEN --linken-port 40080
Alle drei Methoden schreiben in dieselbe config.toml. Wähle die Methode, die dir am angenehmsten ist — das Ergebnis ist identisch.
Schritt 7 — Browser starten und Codex starten
Stelle sicher, dass dein Antidetect-Browser läuft, und starte dann Codex:
CLI
codex
Desktop-App
Öffne die Codex-App. Wähle den „Lokal"-Modus. MCP-Server aus config.toml werden automatisch geladen.
Codex erkennt den Ornold MCP-Server und zeigt die verfügbaren Browser-Tools an. Rede jetzt mit ihm:
# Start a Linken Sphere session
> Start a new Linken Sphere session and open google.com
# Fill a form
> Navigate to example.com/signup, fill email "test@mail.com" and password "Pass123", click Sign Up
# Solve a CAPTCHA
> There's a CAPTCHA on this page, solve it
# Multi-session
> Start 3 Linken Sphere sessions and open google.com in all of them
# Visual analysis
> Take a screenshot and describe what you see on the page
Verfügbare MCP-Tools
Sobald verbunden, hat Codex Zugriff auf 40+ Browser-Automatisierungs-Tools:
- linken_start_instances / dolphin_start_profiles — Browser-Sitzungen starten
- browser_parallel_navigate — URLs in allen aktiven Browsern öffnen
- browser_parallel_snapshot — Seiten-DOM mit anklickbaren [ref=N]-Markierungen abrufen
- browser_parallel_click — Elemente per Ref oder Selektor anklicken
- browser_parallel_fill — Text in Eingabefelder eingeben
- browser_parallel_screenshot — Screenshots aller Sitzungen aufnehmen
- browser_parallel_vision_analyze_grouped — KI-gestützte visuelle Seitenanalyse
- browser_solve_captcha — reCAPTCHA, hCaptcha, Turnstile und mehr automatisch lösen
- browser_parallel_evaluate — JavaScript im Seitenkontext ausführen
- linken_stop_instances / dolphin_stop_profiles — Sitzungen schließen
Du musst dir keine Tool-Namen merken. Beschreibe einfach, was du möchtest, in einfacher Sprache — Codex wählt automatisch die richtigen Tools.
Tool-Genehmigungsrichtlinie
Codex hat drei Genehmigungsmodi, die steuern, wie es Tools ausführt:
- „untrusted" — Codex fragt vor jedem Tool-Aufruf um Erlaubnis (sicherste, Standard)
- „on-request" — Codex fragt nur bei destruktiven oder unbekannten Tools
- „never" — Codex führt alle Tools ohne Nachfrage aus (schnellste, mit Vorsicht verwenden)
Setze den Standard in config.toml:
# ~/.codex/config.toml
approval_policy = "on-request"
Oder überschreibe pro Tool für Ornold:
[mcp_servers.ornold-browser.tools.browser_parallel_navigate]
approval_mode = "approve"
[mcp_servers.ornold-browser.tools.browser_solve_captcha]
approval_mode = "approve"
Fehlerbehebung
- „npx: Befehl nicht gefunden" — Node.js nicht im PATH. Terminal nach der Installation neu starten.
- „MCP Handshake fehlgeschlagen" in der Codex Desktop-App — Die Desktop-App erbt nicht den PATH des Terminals (nvm/fnm-Pfade fehlen). Lösung: Führe `which npx` im Terminal aus, dann verwende den vollständigen Pfad in config.toml: `command = "/Users/you/.nvm/versions/node/v22.x.x/bin/npx"` statt nur `"npx"`.
- „codex: Befehl nicht gefunden" — Führe `npm install -g codex` erneut aus. Auf macOS benötigst du möglicherweise `sudo`.
- „Verbindung zu Linken Sphere nicht möglich" — Stelle sicher, dass Sphere läuft und der API-Port korrekt ist (Standard 40080).
- „Token ungültig" — Kopiere den Token erneut von mcp.ornold.com. Stelle sicher, dass du den vollständigen String erhalten hast.
- „MCP-Server wird nicht geladen" — Überprüfe die Syntax von config.toml. TOML ist formatierungsempfindlich. Verwende ggf. einen TOML-Validator.
- „CAPTCHA-Lösung fehlgeschlagen" — Überprüfe dein CAPTCHA-Guthaben im Ornold-Dashboard.
- Codex App findet config nicht — Stelle sicher, dass config.toml unter ~/.codex/config.toml liegt (nicht in einem Projektordner).
Was kommt als Nächstes?
- Lies die Claude Code + Ornold MCP-Anleitung, wenn du auch Claude Code verwendest
- Lerne mehr über parallele Browser-Automatisierung für den Betrieb von 10+ Sitzungen gleichzeitig
- Schau dir die CAPTCHA-Lösungsanleitung für den Umgang mit reCAPTCHA, hCaptcha und Turnstile an
- Erkunde den Vision AI-Modus für die Interaktion mit komplexen visuellen Oberflächen





