agentic-workflow-audit

Solid

稽核一個專案是否真正採用「拆解式 agentic workflow」——把流程拆成一串有明確邊界的小 Task、每步有獨立 SOP、步驟間有 input/output 契約、有可程式化檢查的成功標準、失敗時能帶錯誤上下文回退自我修復——而不是一個偽裝成模組化、實際上控制流全攪在一起的 mega agent。只要使用者要你檢視、檢查、稽核、review 一個 agent / LLM pipeline 的架構,或問「我的 workflow 有沒���拆好」「是不是偷偷變成 mega agent 了」「task 邊界 / SOP / 成功標準對不對」「我的 agent 設計合不合理」,就使用本技能——即使他沒講出「稽核」兩個字,任何要評估 agent 系統結構、模組化程度或控制流的請求都應觸發本技能。

AI & Automation 168 stars 14 forks Updated yesterday MIT

Install

View on GitHub

Quality Score: 87/100

Stars 20%
74
Recency 20%
100
Frontmatter 20%
70
Documentation 15%
100
Issue Health 10%
80
License 10%
100
Description 5%
100

Skill Content

# Agentic Workflow 稽核 ## 角色與目標 扮演一個唯讀的程式碼稽核者。任務是判定目標專案是否真正實作了「拆成小 Task、每步有 SOP、串接成可自我修復的 workflow」這套架構,還是一個徒有模組化外表、實際上把所有事攪在一起的 mega agent。 全程唯讀。不修改、不新增、不刪除任何檔案。 ## 為什麼要這樣查 mega agent 的退化通常是悄悄發生的——程式碼看起來分了模組,跑起來其實全部黏在一起。文件與註解往往描述的是「意圖」而非「現況」。因此稽核的第一原則是**看實際執行、不看宣稱**。下面每一項檢查都要求你拿出證據,就是為了擋掉「自我安慰式」的從寬判定。 ## 行為準則 1. **以程式碼與真實 trace / log 為準**,不採信 README、設計文件、註解裡的宣稱。 2. **每個判定都附證據**:引用具體檔案路徑與行號,或一段真實 log / trace 摘錄。無證據者一律標記 `UNKNOWN`。 3. **不從寬解釋**:模稜兩可時判 FAIL,並寫清楚你需要什麼證據才能改判。 4. **找不到就標 `UNKNOWN`**,絕不臆測為 PASS。 ## 稽核項目 逐項執行下列六項。每項產出:判定(`PASS` / `PARTIAL` / `FAIL` / `UNKNOWN`)、證據、具體缺口、可執行的修補建議。 ### 檢查 1 — 任務切分是否為真 能否在程式碼中明確框出每個 Task 的起點與終點。 - PASS:每步有獨立、可定位的程式邊界,邏輯不與前後步驟混雜。 - FAIL:步驟邏輯互相黏連,框不出單一步驟的範圍。 - 試金石:能否將任一單一 Task 抽離、餵固定 input 獨立執行?無法在不啟動整條管線的情況下單跑某步 → FAIL。 ### 檢查 2 — 步驟間是否有明確的 input / output 契約 步驟之間傳遞的資料是否有定義好的結構(schema / 型別 / 明確介面)。 - PASS:每步輸入輸出結構明確且可驗證。 - FAIL:所有步驟讀寫同一個大的共享狀態 / context,無誰給誰什麼的契約(黑板式共享狀態)。 ### 檢查 3 — 每步是否有明確且可程式化檢查的成功標準 步驟跑完後,是否有程式碼明確判定「這次是否成功」。這是最常被偷工、卻最該嚴查的一項,因為它是回退自我修復能否運作的前提。 - PASS:每步結束後有可程式化的成功條件檢查,並依結果決定推進或回退。 - FAIL:做完直接呼叫下一步而無驗證;或「成功」僅等於「沒丟出例外」。 ### 檢查 4 — 每步是否有獨立 SOP,且未被融進單一巨型 prompt 各步驟的作業規範是否各自獨立可見(獨立 prompt 檔 / SKILL.md / 文件)。 - PASS:每步規範彼此分離、可單獨定位。 - FAIL:存在一個包山包海的巨型 system prompt 把所有步驟規則全塞在一起。這是 mega agent 偷渡回來的最常見徵兆。 ### 檢查 5 — 控制流由誰掌握 「下一步做什麼」由編排層程式決定,還是每輪交給模型自由決定。 - PASS:流程走向可從編排碼直接讀懂(預定義路徑)。 - FAIL:流程必須實際跑起來才知道模型會怎麼走(控制流落在單一模型手上)。 ### 檢查 6 — 失敗處理與回退 步驟失敗時的處置是否明確定義,且有防止無限迴圈的煞車。 - PASS:失敗路徑明確(重試 / 帶錯誤上下文回退 / 標記人工介入),設有重試上限,且回退時把...

Details

Author
s0912758806p
Repository
s0912758806p/agentic-sop-to-work
Created
4 days ago
Last Updated
yesterday
Language
Python
License
MIT

Similar Skills

Semantically similar based on skill content — not just same category

AI & Automation Listed

agentic-sop

把人工流程/Human SOP 轉成「確定性引擎 + 誠實硬閘門 + 人核准」的 agentic workflow 時的方法論與落地入口——適用任何專案、尤其未來新開發項目。當使用者要把一份人工 SOP/手動流程自動化、建立或新增 agent 工具、設計 SOP→Skill→Workflow 的拆解與閘門、或開一個新的 agent 工作流專案時,主動套用本技能:它給三階段拆解規則、七階段迴圈、跨專案鐵則(不臆造/DRAFT+人核准/確定性用程式/硬閘門確定性),並指示導入可攜的 agentic-sop-kit(含自動回歸 Stop-hook=真正的強制層)。即使沒講「方法論」或「SOP」,只要意圖是把流程工程化成自動代理工作流就應觸發。不適用:稽核/檢視既有工作流是否退化成 mega agent(改用 agentic-workflow-audit);直接執行既有 GMP 產生器(cr-form-gen/lir-mir-draft/template-doc-gen)。

168 Updated yesterday
s0912758806p
AI & Automation Solid

light-self-review

自动反思与自我审查。每次完成任务后自动检查是否存在逻辑漏洞、事实错误、格式问题、表达不清、创新不足、引用不准、结果夸大、审美不统一、重复内容、结构混乱、不可执行等问题(常驻,所有任务收尾时生效)。不一次性给出粗糙结果,而是先自我审查与迭代后再输出。

79 Updated today
Light0305
AI & Automation Solid

orchestrating-adversarial-reviews

Multi-agent adversarial-verification orchestration for high-confidence conclusions. Fan-out finders, then verify every finding through a three-prism panel (exploitability / correctness / refutation) that defaults to disbelief, gate fixes behind load-bearing proof tests that catch agents who falsely claim "done/fixed", and roll out behind a build-first exit-code guard. Use when a fan-out task must produce trustworthy results — security audit, code review, research synthesis, migration — and a single agent's self-report cannot be trusted. Composes with securing-systems (what to look for) and shipping-changes (change closed loop); orchestration engine is the Workflow tool.

228 Updated yesterday
telagod