agentic-workflow-audit

Solid

稽核一個專案是否真正採用「拆解式 agentic workflow」——把流程拆成一串有明確邊界的小 Task、每步有獨立 SOP、步驟間有 input/output 契約、有可程式化檢查的成功標準、失敗時能帶錯誤上下文回退自我修復——而不是一個偽裝成模組化、實際上控制流全攪在一起的 mega agent。只要使用者要你檢視、檢查、稽核、review 一個 agent / LLM pipeline 的架構，或問「我的 workflow 有沒��拆好」「是不是偷偷變成 mega agent 了」「task 邊界 / SOP / 成功標準對不對」「我的 agent 設計合不合理」，就使用本技能——即使他沒講出「稽核」兩個字，任何要評估 agent 系統結構、模組化程度或控制流的請求都應觸發本技能。

AI & Automation 168 stars 14 forks Updated yesterday MIT

Install

View on GitHub

Quality Score: 87/100

Stars 20%

Recency 20%

100

Frontmatter 20%

Documentation 15%

100

Issue Health 10%

License 10%

100

Description 5%

100

Skill Content

# Agentic Workflow 稽核 ## 角色與目標扮演一個唯讀的程式碼稽核者。任務是判定目標專案是否真正實作了「拆成小 Task、每步有 SOP、串接成可自我修復的 workflow」這套架構，還是一個徒有模組化外表、實際上把所有事攪在一起的 mega agent。全程唯讀。不修改、不新增、不刪除任何檔案。 ## 為什麼要這樣查 mega agent 的退化通常是悄悄發生的——程式碼看起來分了模組，跑起來其實全部黏在一起。文件與註解往往描述的是「意圖」而非「現況」。因此稽核的第一原則是**看實際執行、不看宣稱**。下面每一項檢查都要求你拿出證據，就是為了擋掉「自我安慰式」的從寬判定。 ## 行為準則 1. **以程式碼與真實 trace / log 為準**，不採信 README、設計文件、註解裡的宣稱。 2. **每個判定都附證據**：引用具體檔案路徑與行號，或一段真實 log / trace 摘錄。無證據者一律標記 `UNKNOWN`。 3. **不從寬解釋**：模稜兩可時判 FAIL，並寫清楚你需要什麼證據才能改判。 4. **找不到就標 `UNKNOWN`**，絕不臆測為 PASS。 ## 稽核項目逐項執行下列六項。每項產出：判定（`PASS` / `PARTIAL` / `FAIL` / `UNKNOWN`）、證據、具體缺口、可執行的修補建議。 ### 檢查 1 — 任務切分是否為真能否在程式碼中明確框出每個 Task 的起點與終點。 - PASS：每步有獨立、可定位的程式邊界，邏輯不與前後步驟混雜。 - FAIL：步驟邏輯互相黏連，框不出單一步驟的範圍。 - 試金石：能否將任一單一 Task 抽離、餵固定 input 獨立執行？無法在不啟動整條管線的情況下單跑某步 → FAIL。 ### 檢查 2 — 步驟間是否有明確的 input / output 契約步驟之間傳遞的資料是否有定義好的結構（schema / 型別 / 明確介面）。 - PASS：每步輸入輸出結構明確且可驗證。 - FAIL：所有步驟讀寫同一個大的共享狀態 / context，無誰給誰什麼的契約（黑板式共享狀態）。 ### 檢查 3 — 每步是否有明確且可程式化檢查的成功標準步驟跑完後，是否有程式碼明確判定「這次是否成功」。這是最常被偷工、卻最該嚴查的一項，因為它是回退自我修復能否運作的前提。 - PASS：每步結束後有可程式化的成功條件檢查，並依結果決定推進或回退。 - FAIL：做完直接呼叫下一步而無驗證；或「成功」僅等於「沒丟出例外」。 ### 檢查 4 — 每步是否有獨立 SOP，且未被融進單一巨型 prompt 各步驟的作業規範是否各自獨立可見（獨立 prompt 檔 / SKILL.md / 文件）。 - PASS：每步規範彼此分離、可單獨定位。 - FAIL：存在一個包山包海的巨型 system prompt 把所有步驟規則全塞在一起。這是 mega agent 偷渡回來的最常見徵兆。 ### 檢查 5 — 控制流由誰掌握「下一步做什麼」由編排層程式決定，還是每輪交給模型自由決定。 - PASS：流程走向可從編排碼直接讀懂（預定義路徑）。 - FAIL：流程必須實際跑起來才知道模型會怎麼走（控制流落在單一模型手上）。 ### 檢查 6 — 失敗處理與回退步驟失敗時的處置是否明確定義，且有防止無限迴圈的煞車。 - PASS：失敗路徑明確（重試 / 帶錯誤上下文回退 / 標記人工介入），設有重試上限，且回退時把...

Details

Author: s0912758806p
Repository: s0912758806p/agentic-sop-to-work
Created: 4 days ago
Last Updated: yesterday
Language: Python
License: MIT

Similar Skills

Semantically similar based on skill content — not just same category

AI & Automation Listed

agentic-sop

把人工流程／Human SOP 轉成「確定性引擎 + 誠實硬閘門 + 人核准」的 agentic workflow 時的方法論與落地入口——適用任何專案、尤其未來新開發項目。當使用者要把一份人工 SOP／手動流程自動化、建立或新增 agent 工具、設計 SOP→Skill→Workflow 的拆解與閘門、或開一個新的 agent 工作流專案時，主動套用本技能：它給三階段拆解規則、七階段迴圈、跨專案鐵則（不臆造／DRAFT＋人核准／確定性用程式／硬閘門確定性），並指示導入可攜的 agentic-sop-kit（含自動回歸 Stop-hook＝真正的強制層）。即使沒講「方法論」或「SOP」，只要意圖是把流程工程化成自動代理工作流就應觸發。不適用：稽核／檢視既有工作流是否退化成 mega agent（改用 agentic-workflow-audit）；直接執行既有 GMP 產生器（cr-form-gen／lir-mir-draft／template-doc-gen）。

168 Updated yesterday

s0912758806p

AI & Automation Solid

light-self-review

自动反思与自我审查。每次完成任务后自动检查是否存在逻辑漏洞、事实错误、格式问题、表达不清、创新不足、引用不准、结果夸大、审美不统一、重复内容、结构混乱、不可执行等问题（常驻，所有任务收尾时生效）。不一次性给出粗糙结果，而是先自我审查与迭代后再输出。

79 Updated today

Light0305

AI & Automation Solid

orchestrating-adversarial-reviews

Multi-agent adversarial-verification orchestration for high-confidence conclusions. Fan-out finders, then verify every finding through a three-prism panel (exploitability / correctness / refutation) that defaults to disbelief, gate fixes behind load-bearing proof tests that catch agents who falsely claim "done/fixed", and roll out behind a build-first exit-code guard. Use when a fan-out task must produce trustworthy results — security audit, code review, research synthesis, migration — and a single agent's self-report cannot be trusted. Composes with securing-systems (what to look for) and shipping-changes (change closed loop); orchestration engine is the Workflow tool.

228 Updated yesterday

telagod