browser-uselisted
Install: claude install-skill Alisha2420/browser-use-skill
# Browser-Use 浏览器自动化
## 何时用 Browser-Use vs 内置 browser tool
| 场景 | 内置 tool | Browser-Use |
|------|:-:|:-:|
| 截图/看页面/点一个按钮 | ✅ 免费快 | ❌ 杀鸡用牛刀 |
| 5步以上流程(登录→导航→填表→提交) | ❌ 容易断 | ✅ |
| 需要反检测(真Chrome) | ❌ | ✅ |
| 批量重复操作 | ❌ | ✅ |
**代价**:Browser-Use 每步调一次外部 LLM(花钱+慢),简单操作用内置 tool。
## 执行流程
### 1. 检查环境
```bash
test -d ~/browser-use-env && echo "已安装" || echo "需要安装"
```
### 2. 首次安装(仅一次)
```bash
python3 -m venv ~/browser-use-env
source ~/browser-use-env/bin/activate
pip install browser-use playwright langchain-openai
playwright install chromium
```
### 3. 决定模式
- **简单场景 / 不怕被检测**:用内置 Chromium(模式A),直接跑
- **需要反检测 / 用户已有登录态**:连真 Chrome(模式B),需用户配合
模式B前置步骤——提示用户:
> 请先完全退出 Chrome(Mac: Cmd+Q),然后告诉我"关了"
用户确认后执行:
```bash
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222 &
# Windows: "C:\Program Files\Google\Chrome\Application\chrome.exe" --remote-debugging-port=9222
# Linux: google-chrome --remote-debugging-port=9222 &
```
验证:`curl -s http://127.0.0.1:9222/json/version`
### 4. 写脚本并运行
脚本写到用户 workspace 下,然后:
```bash
source ~/browser-use-env/bin/activate
python3 脚本路径.py
```
### 5. 反馈结果
运行完把结果发给用户,失败则按故障决策树处理。
## 脚本模板
```python
import asyncio
from browser_use import Agent, ChatOpenAI, Browser
async def main():
# LLM — 任何 OpenAI 兼容 API 均可
llm = ChatOpenAI(
model="gpt-4o-mini",
api_key="<YOUR_API_KEY>",
base_url="https://api.openai.com/v1", # 或其他兼容端点
)
# 模式A: 内置 Chromium
browser = Browser(headless=False