92K Star 仓库里最强的 Skill,只有三句话

一个让我停下来想了很久的 Skill 很火的 superpowers 这个 skill 框架相信很多人都尝试过,我也不例外,但是使用体验并不怎么友好,最大的问题就是太重了,搭配上慢速的 gpt5.5, 有时候一个问题就得跑个把小时, 我也一直在思考,如何让 AI 既能识别我的需求,又可以轻量化一些,比如在我需要的时候才触发? 上周翻 GitHub 的时候刷到 Matt Pocock 的 skills 仓库,92K star ,直接从他自己的 .claude 目录里掏出来的。 里面 20 多个 skill ,TDD 、PRD 、调试、架构重构,什么都有。但我看到那个grill-me时愣了一下。 整个 SKILL.md 就三句话:

Interview me relentlessly about every aspect of this plan until we reach a shared understanding. Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer. Ask the questions one at a time. If a question can be answered by exploring the codebase, explore the codebase instead.

没了。 一个 92K star 仓库里最受欢迎的 skill ,三句话。这本身就挺值得聊聊的。

地址: https://github.com/mattpocock/skills

它到底在解决什么问题 Matt Pocock 在仓库 README 里引用了《 The Pragmatic Programmer 》里的一句话:

"No-one knows exactly what they want."

这不是 AI 时代才有的问题。传统开发里,产品经理觉得说清楚了,开发觉得听懂了,最后交付的时候两边互相看着对方觉得莫名其妙。 AI agent 只是把这个问题放大了。你跟 Claude Code 说"帮我加个搜索功能",它不会问你任何问题,直接开始写代码。等你看到产出的时候——搜索倒是有了,但跟你想的根本不是一回事。 grill-me 的核心洞察是:AI 编码最大的失败模式不是技术能力不够,而是需求对齐不够。 agent 不会主动追问你那些你没说清楚的细节,但如果你强制它追问,它其实问得很到位。 为什么三句话就够了 这个 skill 的设计思想来自 Frederick P. Brooks 的《 The Design of Design 》。Brooks 认为每个功能面前都有一棵决策树——你得沿着每个分支走到底,才能得到一个明确的方案。 比如你要做一个搜索功能:

用全文搜索还是模糊匹配? 如果全文搜索,用 Elasticsearch 还是 Meilisearch ? 需要支持中文分词吗? 搜索结果要不要高亮? 高亮的样式怎么定?

每个问题下面还有子问题。你不把这些走完,agent 拿到的就是一个模糊的需求,它只能靠猜。 grill-me 做的事情就是让 agent 像一个严格的 code reviewer 一样,把每个决策点都逼你做决定。有人试过一次 grilling session 跑了 38 个问题——他说最后那些问题里有一半他自己都没想过。 三句话之所以够,是因为它不需要定义问什么。它定义的是交互模式:逐个追问、逐个解决、能自己查的不问。 具体问什么,让 agent 根据你的项目自己判断。 这就是好的 skill 设计——不告诉 agent 该做什么,告诉它该怎么思考。

升级版 grill-me 还有个升级版叫 grill-with-docs,多了一个关键能力:维护项目词汇表。 具体来说,它会在 grilling 过程中:

检查你用的术语是否和 CONTEXT.md 里已有的定义冲突 当你说的词太模糊时,帮你精确化("你说的'账户'是指 Customer 还是 User ?") 用具体场景压测你定义的领域关系 把确认好的术语实时写入 CONTEXT.md 只在满足三个条件时才创建 ADR ( Architecture Decision Record )

这个版本解决了一个更深层的问题:agent 每次新 session 都是失忆的。 如果项目里没有一份统一的术语表,agent 每次都要重新猜你的术语含义。有了 CONTEXT.md,至少在同一个项目里,你和 agent 说的"订单取消"是同一件事。 当然,我们也可以自己根据实际需求和场景,来做出最适合自己的 skill! 它不是孤立的 grill-me 之所以强大,还因为它跟仓库里其他 skill 形成了一个完整的工作流:

/grill-me — 强制对齐需求 /to-prd — 把对话浓缩成 PRD /to-issues — 把 PRD 拆成独立可交付的 issue /tdd — 红绿重构,一个 slice 一个 slice 地交付 /improve-codebase-architecture — 定期清理技术债

这不是一个工具,是一套工作方法。grill-me 是入口,解决的是"对齐"这个最前面的问题。后面的一切——PRD 、拆 issue 、TDD 、重构——都建立在"你已经想清楚了"这个前提上。我目前主要是使用 grill-me 帮我补齐一些没有考虑周全的问题! 我的使用体感 我自己在使用 OpenClaw 过程中也有设置类似的机制——SOUL.md 里写了"强制澄清触发器",规定了哪些场景必须追问、不能默认继续。看到 grill-me 之后我觉得它把这个理念提炼得更纯粹了。 几个实操感受: 它不适合所有场景。 如果你已经很清楚要做什么,只想让 agent 快速执行,grill session 反而是负担。它适合的是"我想做个东西但还没完全想清楚"的阶段。 它的价值不只是提问,是"能自己查的不问"这条规则。 很多 agent 会问一堆你已经在代码里写过的问题,grill-me 要求 agent 先探索 codebase 再提问,这节省了大量时间。 三句话的设计哲学值得学习。 好的 skill 不是越详细越好,而是定义清楚交互模式和约束,让 agent 有足够的自由度去适配具体情况。 装一个试试 安装很简单,直接在你使用的工具里面,给他发送仓库地址就行啦! 都用 AI 了,就别再自己去手动下载了! 装完之后在 Claude Code 里输入 /grill-me,描述你的计划,然后准备好被灵魂拷问。 最后 Matt Pocock 这个仓库最打动我的不是某个具体的 skill ,而是它背后的立场:AI 编码不等于 vibe coding 。 我们这个时代不缺"帮我写个 XXX"的 prompt ,缺的是"帮我想清楚 XXX 到底该怎么做"的方法论。grill-me 用三句话做到了这件事。 软件工程的基本功没有因为 AI 变强而过时。需求对齐、领域建模、测试驱动、架构审查——这些东西只会越来越重要,因为 AI 加速了编码,也加速了错误决策的后果。