deep-researchlisted
Install: claude install-skill malue-ai/dazee-small
# 深度调研
执行多步骤自主调研:市场分析、竞品研究、行业报告、文献综述。自动搜索、分析、综合,生成完整调研报告。
## 使用场景
- 用户说「帮我调研 AI 办公助手市场」「分析前 5 名竞品」
- 用户说「做一份行业趋势报告」「调研这个赛道的机会」
- 用户说「帮我深入研究这个话题,写一份完整报告」
- 用户说「收集整理过去一周AI行业的热点新闻资讯」
## 执行方式
使用爬虫类 Skill(如 Crawl4AI)快速获取完整网页内容,大幅缩短调研时间。
### 调研流程
```
Step 1: 理解调研目标
↓ 明确范围、深度、输出格式
Step 2: 制定调研计划
↓ 拆解为 3-5 个子课题
Step 3: 批量搜索 + 内容抓取 (核心)
↓ 3.1 调用 web_search 工具获取相关 URL 列表 (自动选择 Tavily/Exa/Jina)
↓ 3.2 爬虫类 Skill (Crawl4AI) 并发抓取完整内容
↓ Playwright 浏览器引擎 → 突破反爬
↓ PruningContentFilter → 去除噪声
↓ 自动输出干净 Markdown
Step 4: 交叉验证
↓ 多个来源互相印证
Step 5: 综合分析
↓ 发现趋势、对比、洞察
Step 6: 生成报告
↓ 结构化输出
```
### 实现示例
```python
from crawl4ai import AsyncWebCrawler, CrawlerRunConfig, CacheMode
from crawl4ai.content_filter_strategy import PruningContentFilter
from crawl4ai.markdown_generation_strategy import DefaultMarkdownGenerator
# Step 1: 调用 web_search 工具获取 URL(自动选择最佳搜索源)
search_queries = ["AI 办公助手 市场分析", "AI 办公助手 竞品对比"]
all_urls = []
for query in search_queries:
# 直接调用 web_search 工具(自动降级 Tavily → Exa → Jina)
results = await web_search(query=query, max_results=10, search_depth="advanced")
all_urls.extend([r["url"] for r in results.get("results", [])[:5]])
unique_urls = list(set(all_urls))[:15]
# Step 2: Crawl4AI 并发抓取完整内容
config = CrawlerRunConfig(
cache_mode=CacheMode.BYPASS,
markdown_generator=DefaultMarkdownGenerator(
content_filter=PruningContentFilter(threshold=0.4)
),
)
async with AsyncWebCrawler() as crawler:
results = await c