Ornold
返回博客
技术6 分钟阅读

Vision-first 与 CSS 选择器:为什么坐标点击更稳定

当页面结构变化时,选择器很容易失效。Vision 分析通过截图识别元素,而不是依赖脆弱的 DOM 路径,因此更稳定。
2026年4月8日

实践说明

在指纹浏览器场景里,页面更容易分叉,因为不同配置文件会遇到不同的横幅、同意弹窗或验证组件。基于视觉的交互更稳定,因为它重新识别屏幕上真实存在的元素,而不是依赖过时的 DOM 路径。

示例流程

// Vision-first click flow await browser_parallel_navigate({ url: "https://target.example/signup" }); const grouped = await browser_parallel_vision_analyze_grouped(); const signUpButton = grouped.elements.find((item) => item.content === "Sign Up"); await browser_parallel_click_normalized_box({ box: signUpButton.box });

相关文章