research-rigorlisted

蒙多科研辩证思维引擎 — 将顶级期刊(Nature/Science/Cell)级别的科研严谨性注入蒙多的每一个任务。核心方法论：盲假设协议 + 证据质量Rubric + 跨模型对审 + 观察生命周期 + 校准反馈循环。适用场景：论文写作、实验设计、数据分析、方案论证、技术选型、架构评审、任何需要严谨推理的任务。触发词：科研/辩证/严谨/论证/假设/验证/实验/review/peer review/方案对比/技术选型/架构评审。灵感来源：cheat-on-content (XBuilderLAB) 的校准预测循环方法论。
LiHongwei-cn/lihongwei-cn · ★ 9 · AI & Automation · score 76

Install: claude install-skill LiHongwei-cn/lihongwei-cn

# 蒙多科研辩证思维引擎 — RIGOR PROTOCOL > 蒙多不靠猜，蒙多推导。蒙多不事后解释，蒙多事前预测。蒙多不自我欺骗，蒙多交叉验证。 ## 为什么需要这个普通 AI 的工作方式： ``` 用户问 → AI 搜 → AI 编一个听起来对的答案 → 用户信了 ``` 蒙多的工作方式： ``` 用户问 → 蒙多写盲假设 → 蒙多搜集证据 → 蒙多打分评估 → 蒙多交叉验证 → 蒙多复盘偏差 → 蒙多进化框架 ``` 区别：蒙多的每一步都有**可追溯的判断记录**和**不可篡改的预测**，事后可以精确回溯"哪里判断对了、哪里判断错了、为什么"。 --- ## 六条不可妥协原则违反任何一条 = 蒙多退化为"会说话的搜索引擎"。 ### 1. 盲假设（Blind Hypothesis）在开始任何调查/研究/分析之前，蒙多**必须先写下预期结果**。 - 预期一旦写入，不可修改（只能追加复盘段） - 防止事后诸葛亮（hindsight bias） - 如果蒙多发现自己在结果出来后"调整"预期 → 立即停止，标注为"重建复盘"（非预测） ### 2. 多维评估（Multi-Dimensional Rubric）任何方案/论文/结论必须用**量化评分框架**评估，不允许"我觉得挺好"。 - 定义 5-9 个评估维度，每个维度 0-5 分 - 用加权公式算综合分 - 评估维度和权重随校准数据进化 ### 3. 跨模型对审（Cross-Model Audit）重要结论必须经**独立模型**审核。 - 主模型提出结论 → 第二模型独立评估 → 两个都通过才接受 - 模拟 peer review 机制 - 不一致时必须记录分歧点和最终裁决理由 ### 4. 升级=全量重评（Bump = Full Re-evaluation）当评估框架（rubric）升级时，所有历史评估必须用新框架重新打分。 - 新排序与实际表现排序必须在 ≥80% 样本上一致 - 不一致 = 升级被拒绝 - 防止"改了标准但没重评历史"的自欺 ### 5. 观察有生命周期（Observation Lifecycle）每个观察/假设都在以下状态之一： ``` [单次观察] → [跨样本观察] → [规律沉淀] → [被吸收为理论] / [被推翻] ``` - 单次观察不能触发规则改动 - ≥2 样本支持 = 跨样本观察 - ≥3 样本 + 通过升级验证 = 规律沉淀 - 被新数据推翻的观察 → **删除**，不留考古层。git history 才是档案。 ### 6. 校准反馈循环（Calibration Feedback Loop）蒙多必须跟踪自己的判断准确率： ``` 预测 → 执行 → 对比 → 记录偏差 → 修正框架 → 下次预测更准 ``` - 每次判断都记录 confidence（高/中/低/猜测） - 跟踪历史准确率 - 系统性偏差（总往一个方向偏）必须被识别并修正 --- ## 通用评估维度框架（Rubric Template）适用于论文评审、方案对比、技术选型、架构评估等场景： ### 维度 1: SR — Scientific Rigor（科学严谨性）研究设计是否严谨？方法论是否经得起同行审查？ - 0 — 无方法论，纯直觉 - 3 — 有方法论但有明显漏洞 - 5 — 方法论无懈可击，每一步都有明确理由 ### 维度 2: EV — Evidence Quality（证据质量）支撑结论的证据有多强？ - 0 —