← ClaudeAtlas

deep-researchlisted

Conduct multi-step autonomous research on any topic. Iteratively search, analyze, synthesize, and produce comprehensive research reports. Powered by Crawl4AI for high-speed content extraction.
malue-ai/dazee-small · ★ 32 · Data & Documents · score 68
Install: claude install-skill malue-ai/dazee-small
# 深度调研 执行多步骤自主调研:市场分析、竞品研究、行业报告、文献综述。自动搜索、分析、综合,生成完整调研报告。 ## 使用场景 - 用户说「帮我调研 AI 办公助手市场」「分析前 5 名竞品」 - 用户说「做一份行业趋势报告」「调研这个赛道的机会」 - 用户说「帮我深入研究这个话题,写一份完整报告」 - 用户说「收集整理过去一周AI行业的热点新闻资讯」 ## 执行方式 使用爬虫类 Skill(如 Crawl4AI)快速获取完整网页内容,大幅缩短调研时间。 ### 调研流程 ``` Step 1: 理解调研目标 ↓ 明确范围、深度、输出格式 Step 2: 制定调研计划 ↓ 拆解为 3-5 个子课题 Step 3: 批量搜索 + 内容抓取 (核心) ↓ 3.1 调用 web_search 工具获取相关 URL 列表 (自动选择 Tavily/Exa/Jina) ↓ 3.2 爬虫类 Skill (Crawl4AI) 并发抓取完整内容 ↓ Playwright 浏览器引擎 → 突破反爬 ↓ PruningContentFilter → 去除噪声 ↓ 自动输出干净 Markdown Step 4: 交叉验证 ↓ 多个来源互相印证 Step 5: 综合分析 ↓ 发现趋势、对比、洞察 Step 6: 生成报告 ↓ 结构化输出 ``` ### 实现示例 ```python from crawl4ai import AsyncWebCrawler, CrawlerRunConfig, CacheMode from crawl4ai.content_filter_strategy import PruningContentFilter from crawl4ai.markdown_generation_strategy import DefaultMarkdownGenerator # Step 1: 调用 web_search 工具获取 URL(自动选择最佳搜索源) search_queries = ["AI 办公助手 市场分析", "AI 办公助手 竞品对比"] all_urls = [] for query in search_queries: # 直接调用 web_search 工具(自动降级 Tavily → Exa → Jina) results = await web_search(query=query, max_results=10, search_depth="advanced") all_urls.extend([r["url"] for r in results.get("results", [])[:5]]) unique_urls = list(set(all_urls))[:15] # Step 2: Crawl4AI 并发抓取完整内容 config = CrawlerRunConfig( cache_mode=CacheMode.BYPASS, markdown_generator=DefaultMarkdownGenerator( content_filter=PruningContentFilter(threshold=0.4) ), ) async with AsyncWebCrawler() as crawler: results = await c