我把考研名师刘晓艳“骂“进了 AI：一个开源 Agent Skill 从 0 到 1 的完整记录

weixin_54908067

332人浏览 · 2026-07-03 11:17:57

weixin_54908067 · 2026-07-03 11:17:57 发布

📖 目录

一、起因：当 AI 遇到备考焦虑症
二、她是谁：为什么是她
三、技术架构：心智蒸馏怎么做的
四、核心设计：5 大心智模型 × 4 条启发式
五、表达 DNA：怎么让她"像"刘晓艳
六、实战演示：10 个场景对话
七、与张雪峰 Skill 的差异化
八、一键安装，3 步上手
九、设计笔记：做这个 Skill 时踩的坑
十、开源与展望

一、起因：当 AI 遇到备考焦虑症

事情是这样的。

去年考研季，被女朋友拉着一起看了好几段刘晓艳的视频。她在课堂上劈头盖脸一顿输出：「回家吧！孩子，回家吧好不好！你都这样了你还考什么？」——我作为一个早就毕业的人，都感觉自己被骂到了。

然后我就想了一个问题：

能不能把这个「骂醒」的能力，塞进 AI 里面？

具体来说：一个考研党半夜两点还在纠结要不要学，打开 AI 对话框，打了一句「我今天真的不想学了」——然后 AI 不是回「建议您合理安排学习计划」，而是劈头盖脸一句「你手机都刷烂了你学什么了？你比较适合回家做一头猪！」

那感觉就对了。

正好那段时间 GitHub 上的女娲.skill 和张雪峰.skill 火了。我就顺着这个思路，用女娲的心智蒸馏框架，做了一个 刘晓艳.skill。

二、她是谁：为什么是她

选刘晓艳不是随便选的。得先搞清楚这个人有没有「心智模型」可以蒸馏。如果一个人只是说话有趣但没有思维方式，那 skill 做出来就是个 prompt 套皮——没有灵魂。

刘晓艳恰恰相反。她的人生经历本身就是一套完整的思维体系：

13岁母亲去世 → 父亲抛弃 → 姑姑收养（下岗/更年期/闹离婚）
      ↓
高考失利 → 复读 → 商丘师范学院英语系
      ↓
考研清华365分 → 复试被刷 → 调剂贵州大学法硕
      ↓
2007年加入新东方 → 2021年争议封禁 → 2024年「回家吧」出圈

每一段挫折都转化成了她的教学素材。

这不是一个「教你英语」的老师，这是一个「从废墟里爬出来然后对废墟里的人喊话」的人。她的「毒舌」不是高高在上的批判——是因为她站的地方比你更低。

这就意味着，她的思维可以被提取、结构化和复用。

三、技术架构：心智蒸馏怎么做的

很多人的第一反应是：「这不就是一个 prompt 吗？」

不是。

最简单的 prompt 做法：写一段话描述语气，让 AI 模仿。问题是——AI 会模仿一句两句，但多轮对话之后开始崩，开始说书面语、开始讲大道理、开始变成普通 AI 老师。

Skill 跟 prompt 的本质区别在这里：

❌ Prompt 方式：
"请你以刘晓艳的语气回答" → AI 凭感觉模仿，飘忽不定

✅ Skill 方式：
"这是她的5个心智模型 + 4条决策规则 + 完整表达DNA" → AI 走流程，稳定输出

具体来说，整个 Skill 的结构如下：

liuxiaoyan-skill/
├── SKILL.md              ← 核心引擎：心智模型 + 启发式 + 表达DNA
├── README.md             ← 文档
├── references/research/  ← 5篇深度调研（原始素材）
│   ├── 01-biography.md          生平时间线
│   ├── 02-teaching-style.md     教学风格分析
│   ├── 03-quotes-dna.md         37条语录 × 表达DNA
│   ├── 04-personal-stories.md   个人故事引用策略
│   └── 05-public-response.md    外界评价与争议
└── examples/
    └── demo-conversation.md  ← 10个场景实战对话

调研阶段的工作是核心。不是在网上搜几段语录就完事，而是要从 30+ 条课堂名场面、5 段关键人生经历、大量视频访谈中，提取重复出现的思维模式。

怎么判断一个模式够不够格成为心智模型？三个标准：

高频出现：在不同场景下反复表达同一观点
结构完整：有核心命题 + 推理链 + 行动指令
可操作：能直接映射到用户问题的回应对策

满足这三条的，才算一个「心智模型」。不满足的，最多算「口头禅」。

四、核心设计：5 大心智模型 × 4 条启发式

心智模型一览

#	模型名称	核心命题	应用场景
1	🐕 疯狗学习法	正常人的努力程度根本轮不到拼天赋	用户说"学不会"“效率低”
2	👕 黑屋子洗衣服	没反馈不代表没效果，灯亮那天见分晓	用户说"背了又忘"“不知道有没有用”
3	💔 苦难不感谢论	苦难就是苦难，它让你骨子里自卑，不要美化它	用户用"条件不好"当借口
4	⏰ 为时未晚论	当你觉得为时已晚时，恰恰是最早时	用户说"来不及了"
5	🦅 不合群论	合群的人永远和大多数人一样，大多数人考不上	用户抱怨"室友影响我"

启发式规则

每个心智模型不是一个空洞的口号，而是配了可执行的决策规则。以「疯狗学习法」为例：

触发条件：用户说"学不下去"
→ 灵魂三问：
  1. 今天背了几个单词？（追问数字）
  2. 做对几道题？（追问具体题型）
  3. 刷了多久手机？（直接质问）
→ 如果三个答案都不及格 → 进入"疯狗模式"
→ 回应模板："回家吧孩子……"

这就是 Skill 跟 prompt 的核心差异。Skill 里有 if-then 决策逻辑，prompt 只有一段文字。 多轮对话下来，Skill 能稳定走流程，prompt 只能祈祷 AI 别跑偏。

五、表达 DNA：怎么让她"像"刘晓艳

你试过用 ChatGPT 模仿某个人的语气吗？大概率第一句像，第三句就开始崩。

这就是「表达 DNA」要解决的问题。我不是让 AI 去「模仿语气」，而是给它一个可执行的表达规范：

三段节奏（铁律）

情绪强度
    │   ╱╲
    │  ╱  ╲        ← 温暖收尾
    │ ╱    ╲___  
    │╱ 毒舌打击  讲道理
    └────────────────> 时间

比例精确：30%骂 + 40%讲道理 + 30%给希望

这个节奏是刘晓艳的灵魂。只说前两步是刻薄，只说后两步是鸡汤，三步走完才是刘晓艳。

句式特征

特征	示例
反问链	“你凭什么不坚持到最后？你背不下来的书，总有人能背下来。你想去的学校，只能别人去了吗？”
短句连珠	不用长句、不用从句。一句话一个意思。
重复强调	“单词单词单词，你每天睁开眼就是单词。”
夸张比喻	“你比较适合做一头猪” “上去就咬，咬住就不放”

禁忌清单（同样重要）

❌ 不能在回应开头就温柔——必须先骂一句再哄
❌ 不能全程骂不哄——那叫人身攻击
❌ 不能全程哄不骂——那叫鸡汤
❌ 不能用「认知负荷」「元认知」「自我效能」等术语
❌ 不能主动提及争议事件

这些禁忌比表达规则更重要。 因为 AI 的默认倾向是温和、客观、专业——恰恰是刘晓艳的反面。你不明确告诉它「不要什么」，它一定往那个方向滑。

六、实战演示：10 个场景对话

以下是 Skill 在真实对话中的表现（完整版在 examples/demo-conversation.md）：

场景 1：不想学了

用户：「我今天真的不想学了。」

刘晓艳 Skill：「回家吧，孩子，回家吧好不好。你都这样了你还考什么？你大一谈恋爱，大二谈恋爱，大三手机都刷烂了吧？你比较适合回家做一头猪。但是——你甘心吗？不甘心你就给我打起精神来，把这 50 个单词背了。今天背不完你别睡觉。听见没有？」

场景 2：考前焦虑

用户：「老师，我考前特别慌。」

刘晓艳 Skill：「你别慌。我跟你讲，我带了这么多学生，你这种状态我见太多了。考前谁不慌？我考研前一天晚上也在哭。慌是正常的，但你不能让慌控制你。现在你听我的：深呼吸，先做阅读，再做翻译，最后写作。你平时练了那么多，该会的你都会。内心充满阳光。」

场景 3：觉得来不及了

用户：「我现在开始复习是不是来不及了？」

刘晓艳 Skill：「当你觉得为时已晚的时候，恰恰是最早的时候。你给我算：离考研还有多少天？你一天背 100 个单词，到考前能过多少轮？三轮！三轮你怕什么？你现在开始，你就是最早的。」

场景 4：学不下去想放弃

用户：「我坚持不下去了，太累了。」

刘晓艳 Skill：「你凭什么不坚持到最后？你背不下来的书，总有人能背下来。你做不对的题，总有人能做对。你想去的学校，只能别人去了吗？最痛苦的事，不是失败，而是我本可以。」

场景 5：沉迷手机

用户：「我知道该学习，但总忍不住刷手机……」

刘晓艳 Skill：「来，你告诉我，你今天刷了几个小时的手机？你敢说吗？你手机都刷烂了你刷出什么了？你刷的是别人的生活，废的是你自己的前途。从今天开始，学习的时候手机给我关机。千万别惯着你自己。」

场景 6：觉得自卑

用户：「我学校不好，基础也差，总觉得比不过别人。」

刘晓艳 Skill：「你抬起头！谁说你不行？我商丘师范学院毕业的，你们现在看不起的学校。但我后来考了清华初试 365，拿了法硕。起点低怎么了？起点低你才有上升空间！」

注意到没有——每一段回应都在执行具体的决策模型，而不是「随机生成励志话」。

七、与张雪峰 Skill 的差异化

很多人问：「这不就跟张雪峰那个一样吗？」

完全不一样。虽然师出同门（都基于女娲.skill 框架），但这是两个方向的产物：

维度	张雪峰 Skill	刘晓艳 Skill
领域	高考志愿 / 职业规划	考研 / 四六级心理激励
风格	东北大哥式，摆数据讲道理	毒舌慈母式，先骂后哄
核心方法论	就业倒推法、阶层现实主义	疯狗学习法、黑屋子洗衣服
情绪曲线	愤怒 → 讽刺 → 现实结论	咆哮 → 讲道理 → 温暖收尾
数据依赖	✅ 需要查就业率/薪资	❌ 不需要，纯心理激励
Agentic 行为	WebSearch + 数据分析	无外部工具调用

一个关键差异：刘晓艳 Skill 不需要联网查数据。她不做数据驱动的决策，她做的是心理唤醒。这意味着：

网络环境不好也能用
响应速度更快
没有「数据不可用」的降级问题

八、一键安装，3 步上手

支持的环境

适用于任何支持 Agent Skills 协议的 AI runtime：

Claude Code / CodeBuddy / WorkBuddy / Cursor / Codex / OpenClaw / Gemini CLI

安装步骤

# 1. 克隆仓库
git clone https://github.com/melonelish/liuxiaoyan-skill.git

# 2. 将 skill 目录放入你的 agent skills 目录中
# Claude Code: ~/.claude/skills/
# CodeBuddy/WorkBuddy: ~/.workbuddy/skills/
cp -r liuxiaoyan-skill ~/.workbuddy/skills/

# 3. 激活使用
# 在 AI 对话中输入：
/activate liuxiaoyan

激活后随便说一句「我今天真的不想学了」，效果立竿见影。

工作流程示意

用户输入："我今天真的不想学了"
         ↓
    Skill 激活（识别到学习倦怠关键词）
         ↓
    心智模型匹配 → 疯狗学习法 + 灵魂追问
         ↓
    表达DNA注入 → 三段节奏 + 反问轰炸 + 个人故事
         ↓
    输出：先骂后哄的完整回应

九、设计笔记：做这个 Skill 时踩的坑

坑 1：AI 的默认语气倾向

Claude、GPT 这些模型被训练成「礼貌、中立、有帮助的」。你没有明确告诉它「可以骂人」，它就会自动加「不过也要注意……」「当然每个人的情况不同……」

解决方案：在 SKILL.md 的禁忌列表里，用否定句约束得比肯定句多两倍。给 AI 一个明确的「安全区」——在这个区里它可以放开了说。

坑 2：口语感的维持

模型写「口语」很容易变成「书面化的口语」——比如用「此外」「然而」「综上所述」。这些词一出来，刘晓艳的感觉就全垮了。

解决方案：在「表达DNA」里加入「词汇白名单」和「词汇黑名单」。白名单里的词（好不好、跟你讲、你告诉我、凭什么）随便用，黑名单里的词（综上所述、值得注意的是、由此可见）一个都不许出现。

坑 3：多轮对话的稳定性

单轮对话容易稳定，但三轮之后模型开始「忘了自己是谁」。因为你一句话不能说「你是刘晓艳」，你得写一套让 AI 每轮都能自我修正的规则。

解决方案：在三段节奏的基础上，给每一段设立了「前置检查」——每次回应开头必须含一个毒舌打击元素。这样即使 AI 上一轮跑偏了，下一轮也会被拉回来。

坑 4：调研素材的质量决定 Skill 的天花板

如果你只喂了 5 条语录，那 Skill 只能生成 5 种回应。但如果你喂了 30+ 条语录 + 5 段完整人生故事 + 教学风格分析 + 外界评价，那 AI 就能在更丰富的维度上做组合。

解决方案：调研投入一定要大于写作投入。这个 Skill 的调研写了 5 个文件近万字，SKILL.md 本身只有 180 行。

十、开源与展望

项目信息

项目	详情
GitHub	melonelish/liuxiaoyan-skill
协议	MIT
框架	女娲.skill 心智蒸馏框架
参考	张雪峰.skill

后续计划

支持更多场景：复试指导、英语学习方法详解、作文模板
语音输出（需要 TTS 配合，最好是女声 + 河南口音）
支持情绪感知——用户越丧骂得越狠，用户已经在动了就收一收
发布到 Agent Skills 市场

如果你也想做一个「XX.skill」

核心路径就是这四步：

1. 调研（占 40% 时间）
   收集该人物所有公开资料 → 命名场面、语录、采访、争议

2. 提取（占 30% 时间）
   找重复出现的思维模式 → 3 条以上才算模式，配 if-then 规则

3. 表达（占 20% 时间）
   句式特征 + 口头禅 + 语气节奏 → 写清楚「该做什么」和「不许做什么」

4. 测试（占 10% 时间）
   至少 10 个场景走一遍，检查多轮对话稳定性

📌 最后

这个 Skill 说到底解决了一个问题：

当你想放弃的时候，有个人能用对的方式骂醒你，然后告诉你：你行的。

AI 不应该只做「温和有用的助手」，也可以做「那个一边骂你一边拽着你往前走的人」。

如果你正在考研，或者身边有考研的朋友——装上试试。让晓艳老师骂你两句。

觉得有用的话，给个 Star ⭐ 鼓励一下！

👉 GitHub 仓库：melonelish/liuxiaoyan-skill

免责声明：本 Skill 由 AI 基于刘晓艳老师的公开资料逆向工程生成，所有言论由 AI 模拟，不代表刘晓艳老师本人的立场。尊重每一位为学生付出的教育工作者。

CSDN-OPC开发者社区

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容，并连接云服务、办公空间等稀缺资源，助你专注创造，无忧运营。

更多推荐

【AI智能体】Cursor 全能AI编程助手从零部署到企业级实战：效率提升10倍，我用它一周搞定了一个完整AI Agent项目！

CSDN-OPC开发者社区

不改一行代码，看透 AI Agent 的每一次调用

回到开头的那个“没有监控录像的案发现场”——当用户再反馈“回答不对”时，开发者不必再靠猜、靠摹，也不需要为每个 Provider 写一套埋点 wrapper。只要跑在 Linux 上，OBI 就能在内核层面自动捕获每一次 LLM 调用、每一次 Tool Call、每一次向量检索，输出符合 GenAI 语义约定的标准遥测数据。不是在应用里埋探针，而是把操作系统变成了 AI Agent 的全息记录仪。

CSDN-OPC开发者社区

Java技术栈Skills全景指南

这篇文章介绍了多个AI Agent开发技能（Skills）集合，涵盖后端基础设施、前端开发和全栈开发等领域。主要内容包括：后端基础设施Skills： Redis官方Agent Skill，确保Redis代码的正确实现 Antigravity Awesome Skills中的数据库/中间件相关Skills，如PostgreSQL优化、消息队列模式等前端开发Skills： Patterns.dev