AI 工作流折腾实录:Skills、流程约束和模型遵从度

AI 工作流折腾实录:Skills、流程约束和模型遵从度

这几天一直在折腾 AI 编程工具的 workflow 和 skills,踩了不少坑,也有一些感悟,随便写写。

先说一下 OpenSkills

在 Claude Code 外使用 skills,可以用一个叫做 OpenSkills 的开源库。

和 Claude Code 的 skills 相比最大的区别:

Claude Code 使用 Skill 工具,OpenSkills 使用 openskills read <name> CLI 命令。

Claude Code 系统提示内置在程序里,OpenSkills 的系统提示在 AGENTS.md 中。

接下来就是一些我的经验之谈了,我试着将 skills 和 workflow(或者说斜杠命令)结合创建工作流。

问题与不便

截断问题:

在 Antigravity 或是 VSCode 这些 IDE 中,让 AI 运行 CLI 终端时不时会遇到截断问题。

目前 VSCode 的 Insider 版本似乎已经直接支持 skills 读取了,希望 skills 能尽快得到广泛支持吧。

模型遵从度:

模型有时候可能不会完全遵从你的工作流或是 Skills。这方面一部分是你的提示词的问题,一部分是模型本身的遵从度问题。

后面会展开讲。

对于提示词编写的感悟

1. 流程约束是刚需

一开始我写工作流,就是把所有步骤罗列出来,觉得够清楚了吧?

结果 AI 经常跳步骤,或者提前"预习"后面的内容,搞得整个流程乱套。

后来我加上了这种硬性约束:

严格的执行顺序

  • 必须按照 Step 1 → Step 2 → Step 3 → Step 4 的顺序执行
  • 禁止提前阅读:只有当执行到某个 Step 时,才能阅读该 Step 对应的 Skill 文档
  • 违反此规则将导致工作流失效

说白了就是:不给 AI 偷懒的空间。

2. 语言不能模糊

AI 其实挺"滑头"的。如果你的指令有歧义,它大概率会选择更省事的那个理解方式。

(也许和这些 AI 编程工具本身的提示词有关?)

比如你说"多思考一下",它可能真的就只多想了一点点。

但如果你说:

必须调用 sequentialthinking 进行 5-10步思考。

它就老老实实做了。

精确比友好更重要。

3. 要解释为什么

AI 其实有些像比较沉默寡言、不会向你提问而是自行脑补的人。

比如目前对于 Claude 4.5 Sonnet,AI 的知识库没有更新到这个水平,它有很大的概率会把这个直接当成 3.5 Sonnet。

这让我想到一个框架——乔哈里视窗。

有些事情是"我知道但 AI 不知道"的。我们要做的就是把这部分补上。

同理,你让 AI 按某种方式做事,最好解释一下为什么:

必须调用 sequentialthinking 进行 5-15 步发散思考。

为什么? 第一个想法通常是最普通的。突破需要:强迫自己继续想尝试不同角度连接不相关的概念

这样既是给 AI 一个理由,也会引导它向你想要的角度去思考。

4. 工作流必须有产出

这个是被坑出来的经验。

AI 的上下文窗口是有限的,目前各家工具的压缩机制也不太完善(总之肯定不如换新对话)。

因此每个阶段的产出是至关重要的。比如调研阶段产出 research.md,写作阶段产出 article.md

当然,产出多了也是一大难题。项目文件夹里十几二十个文档,你看着都头疼,AI 看着估计也头疼。重复的信息还会占用大量上下文,进一步影响开发。

这个我还在摸索怎么解决。

关于模型选择

说说我目前的模型使用分工:

场景模型
普遍代码编写Claude Sonnet 4.5 & Gemini 3 Flash
前端代码和部分架构设计Gemini 3 Pro
整体计划、项目文档、架构设计Claude Opus 4.5

整体在 Workflow 也是如此。

如果按遵从度排名:Claude Opus 4.5 > Claude Sonnet 4.5 > Gemini 3 Pro

Gemini 3 Pro 给我的感受是,一个孤傲的天才。遇到歧义或是不理解,它不会问你,而是用自己认知中的方法去解决。

而且它喜欢长时间闷头想,不输出中间想法,这就更加剧了我们间的"理解分歧"。

如果要让它好好干活,你得把每一步的意义都解释清楚,还得加上强约束。

相比之下,Gemini 3 Flash 反而更好用。它的感觉更贴近 Sonnet,更像是一个可以依靠和交流的搭档。

所以在实际开发中,我建议:

  • plan 阶段用 Claude Opus
  • 编码阶段用 Sonnet 或 Flash
  • 隔几个阶段就开新对话(哦对,这也是为什么你需要在工作流中明确产出材料)

为什么要在 Workflow 里添加 Skills

不管你用的是 Workflow、斜杠命令,还是直接定义了一个 Agent、SubAgent,道理都是一样的:

我们给了 AI 一个行为规范,希望它能按我们定义的方式执行任务。

Skills 的价值在于两点:

1. 按需加载

把所有技能提示词一股脑灌给 AI,一来浪费 tokens,二来 AI 可能被绕晕。

但如果在 Workflow 里定义好路由,根据当前阶段只加载对应的 Skill,AI 的注意力就更集中。Workflow 也更规范、更易读(无论对于人类还是 AI)。

2. 强化认知

你的提示词会随着对话越来越长而"稀释"。

但如果 AI 在每个阶段都去读一遍对应的 Skill,相当于定期"复习",遵从度就能保持在比较高的水平。

前提:你得有明确的流程设计

上面这些想法,都建立在一个前提上:你自己心里得清楚工作流该怎么跑。

产出是什么、每个环节的思考角度是什么、预期效果是什么——这些你得有数。

AI 是搭档,不是替身。

我也建议和 AI 一起打磨你的提示词。想让它完美复制你的工作流程,最好的办法就是亲手带它做一遍,在交流中一点点调整,而不是闭门造车写一版就甩出去。