返回博客
技术6 分钟阅读
Vision-first 与 CSS 选择器:为什么坐标点击更稳定
当页面结构变化时,选择器很容易失效。Vision 分析通过截图识别元素,而不是依赖脆弱的 DOM 路径,因此更稳定。
2026年4月8日实践说明
在指纹浏览器场景里,页面更容易分叉,因为不同配置文件会遇到不同的横幅、同意弹窗或验证组件。基于视觉的交互更稳定,因为它重新识别屏幕上真实存在的元素,而不是依赖过时的 DOM 路径。
示例流程
// Vision-first click flow
await browser_parallel_navigate({ url: "https://target.example/signup" });
const grouped = await browser_parallel_vision_analyze_grouped();
const signUpButton = grouped.elements.find((item) => item.content === "Sign Up");
await browser_parallel_click_normalized_box({ box: signUpButton.box });