← ClaudeAtlas

browser-uselisted

用 Browser-Use 做复杂网页自动化(多步骤登录、填表、发帖、数据抓取)。当内置 browser tool(snapshot→act)搞不定时用这个——它是专门的浏览器AI agent,一个task丢进去自主完成全流程。触发词:browser-use、浏览器自动化、自动登录、自动填表、自动发帖、网页操控、复杂网页操作。
Alisha2420/browser-use-skill · ★ 0 · AI & Automation · score 72
Install: claude install-skill Alisha2420/browser-use-skill
# Browser-Use 浏览器自动化 ## 何时用 Browser-Use vs 内置 browser tool | 场景 | 内置 tool | Browser-Use | |------|:-:|:-:| | 截图/看页面/点一个按钮 | ✅ 免费快 | ❌ 杀鸡用牛刀 | | 5步以上流程(登录→导航→填表→提交) | ❌ 容易断 | ✅ | | 需要反检测(真Chrome) | ❌ | ✅ | | 批量重复操作 | ❌ | ✅ | **代价**:Browser-Use 每步调一次外部 LLM(花钱+慢),简单操作用内置 tool。 ## 执行流程 ### 1. 检查环境 ```bash test -d ~/browser-use-env && echo "已安装" || echo "需要安装" ``` ### 2. 首次安装(仅一次) ```bash python3 -m venv ~/browser-use-env source ~/browser-use-env/bin/activate pip install browser-use playwright langchain-openai playwright install chromium ``` ### 3. 决定模式 - **简单场景 / 不怕被检测**:用内置 Chromium(模式A),直接跑 - **需要反检测 / 用户已有登录态**:连真 Chrome(模式B),需用户配合 模式B前置步骤——提示用户: > 请先完全退出 Chrome(Mac: Cmd+Q),然后告诉我"关了" 用户确认后执行: ```bash /Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222 & # Windows: "C:\Program Files\Google\Chrome\Application\chrome.exe" --remote-debugging-port=9222 # Linux: google-chrome --remote-debugging-port=9222 & ``` 验证:`curl -s http://127.0.0.1:9222/json/version` ### 4. 写脚本并运行 脚本写到用户 workspace 下,然后: ```bash source ~/browser-use-env/bin/activate python3 脚本路径.py ``` ### 5. 反馈结果 运行完把结果发给用户,失败则按故障决策树处理。 ## 脚本模板 ```python import asyncio from browser_use import Agent, ChatOpenAI, Browser async def main(): # LLM — 任何 OpenAI 兼容 API 均可 llm = ChatOpenAI( model="gpt-4o-mini", api_key="<YOUR_API_KEY>", base_url="https://api.openai.com/v1", # 或其他兼容端点 ) # 模式A: 内置 Chromium browser = Browser(headless=False