92K Star 仓库里最强的 Skill，只有三句话

作者：蓝逸日期：2026-05-20 浏览：580℃ 分类：分享

一个让我停下来想了很久的 Skill 很火的 superpowers 这个 skill 框架相信很多人都尝试过,我也不例外,但是使用体验并不怎么友好,最大的问题就是太重了,搭配上慢速的 gpt5.5, 有时候一个问题就得跑个把小时, 我也一直在思考,如何让 AI 既能识别我的需求,又可以轻量化一些,比如在我需要的时候才触发? 上周翻 GitHub 的时候刷到 Matt Pocock 的 skills 仓库，92K star ，直接从他自己的 .claude 目录里掏出来的。里面 20 多个 skill ，TDD 、PRD 、调试、架构重构，什么都有。但我看到那个grill-me时愣了一下。整个 SKILL.md 就三句话：

Interview me relentlessly about every aspect of this plan until we reach a shared understanding. Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer. Ask the questions one at a time. If a question can be answered by exploring the codebase, explore the codebase instead.

没了。一个 92K star 仓库里最受欢迎的 skill ，三句话。这本身就挺值得聊聊的。

地址: https://github.com/mattpocock/skills

它到底在解决什么问题 Matt Pocock 在仓库 README 里引用了《 The Pragmatic Programmer 》里的一句话：

"No-one knows exactly what they want."

这不是 AI 时代才有的问题。传统开发里，产品经理觉得说清楚了，开发觉得听懂了，最后交付的时候两边互相看着对方觉得莫名其妙。 AI agent 只是把这个问题放大了。你跟 Claude Code 说"帮我加个搜索功能"，它不会问你任何问题，直接开始写代码。等你看到产出的时候——搜索倒是有了，但跟你想的根本不是一回事。 grill-me 的核心洞察是：AI 编码最大的失败模式不是技术能力不够，而是需求对齐不够。 agent 不会主动追问你那些你没说清楚的细节，但如果你强制它追问，它其实问得很到位。为什么三句话就够了这个 skill 的设计思想来自 Frederick P. Brooks 的《 The Design of Design 》。Brooks 认为每个功能面前都有一棵决策树——你得沿着每个分支走到底，才能得到一个明确的方案。比如你要做一个搜索功能：

用全文搜索还是模糊匹配？如果全文搜索，用 Elasticsearch 还是 Meilisearch ？需要支持中文分词吗？搜索结果要不要高亮？高亮的样式怎么定？

每个问题下面还有子问题。你不把这些走完，agent 拿到的就是一个模糊的需求，它只能靠猜。 grill-me 做的事情就是让 agent 像一个严格的 code reviewer 一样，把每个决策点都逼你做决定。有人试过一次 grilling session 跑了 38 个问题——他说最后那些问题里有一半他自己都没想过。三句话之所以够，是因为它不需要定义问什么。它定义的是交互模式：逐个追问、逐个解决、能自己查的不问。具体问什么，让 agent 根据你的项目自己判断。这就是好的 skill 设计——不告诉 agent 该做什么，告诉它该怎么思考。

升级版 grill-me 还有个升级版叫 grill-with-docs，多了一个关键能力：维护项目词汇表。具体来说，它会在 grilling 过程中：

检查你用的术语是否和 CONTEXT.md 里已有的定义冲突当你说的词太模糊时，帮你精确化（"你说的'账户'是指 Customer 还是 User ？"）用具体场景压测你定义的领域关系把确认好的术语实时写入 CONTEXT.md 只在满足三个条件时才创建 ADR （ Architecture Decision Record ）

这个版本解决了一个更深层的问题：agent 每次新 session 都是失忆的。如果项目里没有一份统一的术语表，agent 每次都要重新猜你的术语含义。有了 CONTEXT.md，至少在同一个项目里，你和 agent 说的"订单取消"是同一件事。当然,我们也可以自己根据实际需求和场景,来做出最适合自己的 skill! 它不是孤立的 grill-me 之所以强大，还因为它跟仓库里其他 skill 形成了一个完整的工作流：

/grill-me — 强制对齐需求 /to-prd — 把对话浓缩成 PRD /to-issues — 把 PRD 拆成独立可交付的 issue /tdd — 红绿重构，一个 slice 一个 slice 地交付 /improve-codebase-architecture — 定期清理技术债

这不是一个工具，是一套工作方法。grill-me 是入口，解决的是"对齐"这个最前面的问题。后面的一切——PRD 、拆 issue 、TDD 、重构——都建立在"你已经想清楚了"这个前提上。我目前主要是使用 grill-me 帮我补齐一些没有考虑周全的问题! 我的使用体感我自己在使用 OpenClaw 过程中也有设置类似的机制——SOUL.md 里写了"强制澄清触发器"，规定了哪些场景必须追问、不能默认继续。看到 grill-me 之后我觉得它把这个理念提炼得更纯粹了。几个实操感受：它不适合所有场景。如果你已经很清楚要做什么，只想让 agent 快速执行，grill session 反而是负担。它适合的是"我想做个东西但还没完全想清楚"的阶段。它的价值不只是提问，是"能自己查的不问"这条规则。很多 agent 会问一堆你已经在代码里写过的问题，grill-me 要求 agent 先探索 codebase 再提问，这节省了大量时间。三句话的设计哲学值得学习。好的 skill 不是越详细越好，而是定义清楚交互模式和约束，让 agent 有足够的自由度去适配具体情况。装一个试试安装很简单，直接在你使用的工具里面,给他发送仓库地址就行啦! 都用 AI 了,就别再自己去手动下载了! 装完之后在 Claude Code 里输入 /grill-me，描述你的计划，然后准备好被灵魂拷问。最后 Matt Pocock 这个仓库最打动我的不是某个具体的 skill ，而是它背后的立场：AI 编码不等于 vibe coding 。我们这个时代不缺"帮我写个 XXX"的 prompt ，缺的是"帮我想清楚 XXX 到底该怎么做"的方法论。grill-me 用三句话做到了这件事。软件工程的基本功没有因为 AI 变强而过时。需求对齐、领域建模、测试驱动、架构审查——这些东西只会越来越重要，因为 AI 加速了编码，也加速了错误决策的后果。

转载注明出处：http://dixi.eu.org/32996.html

上一篇用 OCaml 的 Effect System 实现一个完整的 Agent Harness

下一篇看完了 Google I/O 2026，我们这帮全凭感觉写代码的独狼，是不是该向算力税低头了？