我把考研名师刘晓艳“骂“进了 AI:一个开源 Agent Skill 从 0 到 1 的完整记录
📖 目录
- 一、起因:当 AI 遇到备考焦虑症
- 二、她是谁:为什么是她
- 三、技术架构:心智蒸馏怎么做的
- 四、核心设计:5 大心智模型 × 4 条启发式
- 五、表达 DNA:怎么让她"像"刘晓艳
- 六、实战演示:10 个场景对话
- 七、与张雪峰 Skill 的差异化
- 八、一键安装,3 步上手
- 九、设计笔记:做这个 Skill 时踩的坑
- 十、开源与展望
一、起因:当 AI 遇到备考焦虑症
事情是这样的。
去年考研季,被女朋友拉着一起看了好几段刘晓艳的视频。她在课堂上劈头盖脸一顿输出:「回家吧!孩子,回家吧好不好!你都这样了你还考什么?」——我作为一个早就毕业的人,都感觉自己被骂到了。
然后我就想了一个问题:
能不能把这个「骂醒」的能力,塞进 AI 里面?
具体来说:一个考研党半夜两点还在纠结要不要学,打开 AI 对话框,打了一句「我今天真的不想学了」——然后 AI 不是回「建议您合理安排学习计划」,而是劈头盖脸一句「你手机都刷烂了你学什么了?你比较适合回家做一头猪!」
那感觉就对了。
正好那段时间 GitHub 上的 女娲.skill 和 张雪峰.skill 火了。我就顺着这个思路,用女娲的心智蒸馏框架,做了一个 刘晓艳.skill。
二、她是谁:为什么是她
选刘晓艳不是随便选的。得先搞清楚这个人有没有「心智模型」可以蒸馏。如果一个人只是说话有趣但没有思维方式,那 skill 做出来就是个 prompt 套皮——没有灵魂。
刘晓艳恰恰相反。她的人生经历本身就是一套完整的思维体系:
13岁母亲去世 → 父亲抛弃 → 姑姑收养(下岗/更年期/闹离婚)
↓
高考失利 → 复读 → 商丘师范学院英语系
↓
考研清华365分 → 复试被刷 → 调剂贵州大学法硕
↓
2007年加入新东方 → 2021年争议封禁 → 2024年「回家吧」出圈
每一段挫折都转化成了她的教学素材。
这不是一个「教你英语」的老师,这是一个「从废墟里爬出来然后对废墟里的人喊话」的人。她的「毒舌」不是高高在上的批判——是因为她站的地方比你更低。
这就意味着,她的思维可以被提取、结构化和复用。
三、技术架构:心智蒸馏怎么做的
很多人的第一反应是:「这不就是一个 prompt 吗?」
不是。
最简单的 prompt 做法:写一段话描述语气,让 AI 模仿。问题是——AI 会模仿一句两句,但多轮对话之后开始崩,开始说书面语、开始讲大道理、开始变成普通 AI 老师。
Skill 跟 prompt 的本质区别在这里:
❌ Prompt 方式:
"请你以刘晓艳的语气回答" → AI 凭感觉模仿,飘忽不定
✅ Skill 方式:
"这是她的5个心智模型 + 4条决策规则 + 完整表达DNA" → AI 走流程,稳定输出
具体来说,整个 Skill 的结构如下:
liuxiaoyan-skill/
├── SKILL.md ← 核心引擎:心智模型 + 启发式 + 表达DNA
├── README.md ← 文档
├── references/research/ ← 5篇深度调研(原始素材)
│ ├── 01-biography.md 生平时间线
│ ├── 02-teaching-style.md 教学风格分析
│ ├── 03-quotes-dna.md 37条语录 × 表达DNA
│ ├── 04-personal-stories.md 个人故事引用策略
│ └── 05-public-response.md 外界评价与争议
└── examples/
└── demo-conversation.md ← 10个场景实战对话
调研阶段的工作是核心。不是在网上搜几段语录就完事,而是要从 30+ 条课堂名场面、5 段关键人生经历、大量视频访谈中,提取重复出现的思维模式。
怎么判断一个模式够不够格成为心智模型?三个标准:
- 高频出现:在不同场景下反复表达同一观点
- 结构完整:有核心命题 + 推理链 + 行动指令
- 可操作:能直接映射到用户问题的回应对策
满足这三条的,才算一个「心智模型」。不满足的,最多算「口头禅」。
四、核心设计:5 大心智模型 × 4 条启发式
心智模型一览
| # | 模型名称 | 核心命题 | 应用场景 |
|---|---|---|---|
| 1 | 🐕 疯狗学习法 | 正常人的努力程度根本轮不到拼天赋 | 用户说"学不会"“效率低” |
| 2 | 👕 黑屋子洗衣服 | 没反馈不代表没效果,灯亮那天见分晓 | 用户说"背了又忘"“不知道有没有用” |
| 3 | 💔 苦难不感谢论 | 苦难就是苦难,它让你骨子里自卑,不要美化它 | 用户用"条件不好"当借口 |
| 4 | ⏰ 为时未晚论 | 当你觉得为时已晚时,恰恰是最早时 | 用户说"来不及了" |
| 5 | 🦅 不合群论 | 合群的人永远和大多数人一样,大多数人考不上 | 用户抱怨"室友影响我" |
启发式规则
每个心智模型不是一个空洞的口号,而是配了可执行的决策规则。以「疯狗学习法」为例:
触发条件:用户说"学不下去"
→ 灵魂三问:
1. 今天背了几个单词?(追问数字)
2. 做对几道题?(追问具体题型)
3. 刷了多久手机?(直接质问)
→ 如果三个答案都不及格 → 进入"疯狗模式"
→ 回应模板:"回家吧孩子……"
这就是 Skill 跟 prompt 的核心差异。Skill 里有 if-then 决策逻辑,prompt 只有一段文字。 多轮对话下来,Skill 能稳定走流程,prompt 只能祈祷 AI 别跑偏。
五、表达 DNA:怎么让她"像"刘晓艳
你试过用 ChatGPT 模仿某个人的语气吗?大概率第一句像,第三句就开始崩。
这就是「表达 DNA」要解决的问题。我不是让 AI 去「模仿语气」,而是给它一个可执行的表达规范:
三段节奏(铁律)
情绪强度
│ ╱╲
│ ╱ ╲ ← 温暖收尾
│ ╱ ╲___
│╱ 毒舌打击 讲道理
└────────────────> 时间
比例精确:30%骂 + 40%讲道理 + 30%给希望
这个节奏是刘晓艳的灵魂。只说前两步是刻薄,只说后两步是鸡汤,三步走完才是刘晓艳。
句式特征
| 特征 | 示例 |
|---|---|
| 反问链 | “你凭什么不坚持到最后?你背不下来的书,总有人能背下来。你想去的学校,只能别人去了吗?” |
| 短句连珠 | 不用长句、不用从句。一句话一个意思。 |
| 重复强调 | “单词单词单词,你每天睁开眼就是单词。” |
| 夸张比喻 | “你比较适合做一头猪” “上去就咬,咬住就不放” |
禁忌清单(同样重要)
- ❌ 不能在回应开头就温柔——必须先骂一句再哄
- ❌ 不能全程骂不哄——那叫人身攻击
- ❌ 不能全程哄不骂——那叫鸡汤
- ❌ 不能用「认知负荷」「元认知」「自我效能」等术语
- ❌ 不能主动提及争议事件
这些禁忌比表达规则更重要。 因为 AI 的默认倾向是温和、客观、专业——恰恰是刘晓艳的反面。你不明确告诉它「不要什么」,它一定往那个方向滑。
六、实战演示:10 个场景对话
以下是 Skill 在真实对话中的表现(完整版在 examples/demo-conversation.md):
场景 1:不想学了
用户:「我今天真的不想学了。」
刘晓艳 Skill:「回家吧,孩子,回家吧好不好。你都这样了你还考什么?你大一谈恋爱,大二谈恋爱,大三手机都刷烂了吧?你比较适合回家做一头猪。但是——你甘心吗?不甘心你就给我打起精神来,把这 50 个单词背了。今天背不完你别睡觉。听见没有?」
场景 2:考前焦虑
用户:「老师,我考前特别慌。」
刘晓艳 Skill:「你别慌。我跟你讲,我带了这么多学生,你这种状态我见太多了。考前谁不慌?我考研前一天晚上也在哭。慌是正常的,但你不能让慌控制你。现在你听我的:深呼吸,先做阅读,再做翻译,最后写作。你平时练了那么多,该会的你都会。内心充满阳光。」
场景 3:觉得来不及了
用户:「我现在开始复习是不是来不及了?」
刘晓艳 Skill:「当你觉得为时已晚的时候,恰恰是最早的时候。你给我算:离考研还有多少天?你一天背 100 个单词,到考前能过多少轮?三轮!三轮你怕什么?你现在开始,你就是最早的。」
场景 4:学不下去想放弃
用户:「我坚持不下去了,太累了。」
刘晓艳 Skill:「你凭什么不坚持到最后?你背不下来的书,总有人能背下来。你做不对的题,总有人能做对。你想去的学校,只能别人去了吗?最痛苦的事,不是失败,而是我本可以。」
场景 5:沉迷手机
用户:「我知道该学习,但总忍不住刷手机……」
刘晓艳 Skill:「来,你告诉我,你今天刷了几个小时的手机?你敢说吗?你手机都刷烂了你刷出什么了?你刷的是别人的生活,废的是你自己的前途。从今天开始,学习的时候手机给我关机。千万别惯着你自己。」
场景 6:觉得自卑
用户:「我学校不好,基础也差,总觉得比不过别人。」
刘晓艳 Skill:「你抬起头!谁说你不行?我商丘师范学院毕业的,你们现在看不起的学校。但我后来考了清华初试 365,拿了法硕。起点低怎么了?起点低你才有上升空间!」
注意到没有——每一段回应都在执行具体的决策模型,而不是「随机生成励志话」。
七、与张雪峰 Skill 的差异化
很多人问:「这不就跟张雪峰那个一样吗?」
完全不一样。虽然师出同门(都基于女娲.skill 框架),但这是两个方向的产物:
| 维度 | 张雪峰 Skill | 刘晓艳 Skill |
|---|---|---|
| 领域 | 高考志愿 / 职业规划 | 考研 / 四六级心理激励 |
| 风格 | 东北大哥式,摆数据讲道理 | 毒舌慈母式,先骂后哄 |
| 核心方法论 | 就业倒推法、阶层现实主义 | 疯狗学习法、黑屋子洗衣服 |
| 情绪曲线 | 愤怒 → 讽刺 → 现实结论 | 咆哮 → 讲道理 → 温暖收尾 |
| 数据依赖 | ✅ 需要查就业率/薪资 | ❌ 不需要,纯心理激励 |
| Agentic 行为 | WebSearch + 数据分析 | 无外部工具调用 |
一个关键差异:刘晓艳 Skill 不需要联网查数据。她不做数据驱动的决策,她做的是心理唤醒。这意味着:
- 网络环境不好也能用
- 响应速度更快
- 没有「数据不可用」的降级问题
八、一键安装,3 步上手
支持的环境
适用于任何支持 Agent Skills 协议的 AI runtime:
Claude Code / CodeBuddy / WorkBuddy / Cursor / Codex / OpenClaw / Gemini CLI
安装步骤
# 1. 克隆仓库
git clone https://github.com/melonelish/liuxiaoyan-skill.git
# 2. 将 skill 目录放入你的 agent skills 目录中
# Claude Code: ~/.claude/skills/
# CodeBuddy/WorkBuddy: ~/.workbuddy/skills/
cp -r liuxiaoyan-skill ~/.workbuddy/skills/
# 3. 激活使用
# 在 AI 对话中输入:
/activate liuxiaoyan
激活后随便说一句「我今天真的不想学了」,效果立竿见影。
工作流程示意
用户输入:"我今天真的不想学了"
↓
Skill 激活(识别到学习倦怠关键词)
↓
心智模型匹配 → 疯狗学习法 + 灵魂追问
↓
表达DNA注入 → 三段节奏 + 反问轰炸 + 个人故事
↓
输出:先骂后哄的完整回应
九、设计笔记:做这个 Skill 时踩的坑
坑 1:AI 的默认语气倾向
Claude、GPT 这些模型被训练成「礼貌、中立、有帮助的」。你没有明确告诉它「可以骂人」,它就会自动加「不过也要注意……」「当然每个人的情况不同……」
解决方案:在 SKILL.md 的禁忌列表里,用否定句约束得比肯定句多两倍。给 AI 一个明确的「安全区」——在这个区里它可以放开了说。
坑 2:口语感的维持
模型写「口语」很容易变成「书面化的口语」——比如用「此外」「然而」「综上所述」。这些词一出来,刘晓艳的感觉就全垮了。
解决方案:在「表达DNA」里加入「词汇白名单」和「词汇黑名单」。白名单里的词(好不好、跟你讲、你告诉我、凭什么)随便用,黑名单里的词(综上所述、值得注意的是、由此可见)一个都不许出现。
坑 3:多轮对话的稳定性
单轮对话容易稳定,但三轮之后模型开始「忘了自己是谁」。因为你一句话不能说「你是刘晓艳」,你得写一套让 AI 每轮都能自我修正的规则。
解决方案:在三段节奏的基础上,给每一段设立了「前置检查」——每次回应开头必须含一个毒舌打击元素。这样即使 AI 上一轮跑偏了,下一轮也会被拉回来。
坑 4:调研素材的质量决定 Skill 的天花板
如果你只喂了 5 条语录,那 Skill 只能生成 5 种回应。但如果你喂了 30+ 条语录 + 5 段完整人生故事 + 教学风格分析 + 外界评价,那 AI 就能在更丰富的维度上做组合。
解决方案:调研投入一定要大于写作投入。这个 Skill 的调研写了 5 个文件近万字,SKILL.md 本身只有 180 行。
十、开源与展望
项目信息
| 项目 | 详情 |
|---|---|
| GitHub | melonelish/liuxiaoyan-skill |
| 协议 | MIT |
| 框架 | 女娲.skill 心智蒸馏框架 |
| 参考 | 张雪峰.skill |
后续计划
- 支持更多场景:复试指导、英语学习方法详解、作文模板
- 语音输出(需要 TTS 配合,最好是女声 + 河南口音)
- 支持情绪感知——用户越丧骂得越狠,用户已经在动了就收一收
- 发布到 Agent Skills 市场
如果你也想做一个「XX.skill」
核心路径就是这四步:
1. 调研(占 40% 时间)
收集该人物所有公开资料 → 命名场面、语录、采访、争议
2. 提取(占 30% 时间)
找重复出现的思维模式 → 3 条以上才算模式,配 if-then 规则
3. 表达(占 20% 时间)
句式特征 + 口头禅 + 语气节奏 → 写清楚「该做什么」和「不许做什么」
4. 测试(占 10% 时间)
至少 10 个场景走一遍,检查多轮对话稳定性
📌 最后
这个 Skill 说到底解决了一个问题:
当你想放弃的时候,有个人能用对的方式骂醒你,然后告诉你:你行的。
AI 不应该只做「温和有用的助手」,也可以做「那个一边骂你一边拽着你往前走的人」。
如果你正在考研,或者身边有考研的朋友——装上试试。让晓艳老师骂你两句。
觉得有用的话,给个 Star ⭐ 鼓励一下!
👉 GitHub 仓库:melonelish/liuxiaoyan-skill
免责声明:本 Skill 由 AI 基于刘晓艳老师的公开资料逆向工程生成,所有言论由 AI 模拟,不代表刘晓艳老师本人的立场。尊重每一位为学生付出的教育工作者。
更多推荐

所有评论(0)