脱离参数?AI下一站是OpenAI翁家翌Heuristic Learning范式吗?


最近AI技术圈有个小众事件,
背后藏着大意义。
故事开始了,
出场人物是OpenAI翁家翌,
事件是,他在个人博客上发的一篇技术随笔。
随笔里有一个新概念(范式),
叫Heuristic Learning(HL)。
简单解释下,HL是什么?
之前的AI是"黑盒",
它学到了什么,为什么这么决策,
上次出错的原因是什么,
都藏在几十亿个参数里,谁也看不见。
HL反过来,
AI把自己的经验显式写成文件。
文件里有:
这次试了什么、失败了为什么、下次改成什么。
这些文件不仅AI自己能读,人也能读,
新来的AI也能直接接手。
确实是很新的概念。
这个概念,源于翁家翌看到一个现象。
OpenAI的代码产品codex,
产出了不是一份固定的策略代码,
而是一套不断被修改、扩展、维护的软件系统。
他从这个现象里抽象出一个新概念:
Heuristic Learning(HL)。
而且翁家翌指出的现象本身很真实,
coding agent正在让一件事变得可行,
"用代码写策略 + 持续维护"。
我们再来看看具体的,
这套系统里有策略本身、状态检测器、
回归测试、视频回放、实验记录,
而且,这些组件随着任务进行,
被coding agent持续更新。
这就很有意思了。
更有趣的是,
状态-动作-反馈-更新这个闭环结构,
新的HL和深度强化学习不仅共享,还相同。
很有相互参照性。
HL 借了深度强化学习的合法性,
不需要自己从零证明自己是范式。
这在科学论证里,
叫类比迁移(analogical transfer),
是个非常有力的工具。
这一套打下来,以前经验传不下来,
现在直接是写在文件里了。
AI工作三个月,
积累的经验,发现的坑,避开的祸,
全都以文字形式保留下来。
换个AI来接手,
翻开这些文件就能继承前一个AI的所有经验。

如果事情一直变好,会给商业世界带来什么改变?
AI有了成长性,
这是AI 从"工具"变成"员工"必经之路。
老员工的价值就在于"干得越久越懂业务",
过去 AI 没这个能力,现在有了。
HL的真正先进性在于:
AI不只是代替员工"接手"业务,
它在"消化、内化、改写"这项业务的运行方式。
它每天都在调整变化,而且变化是有方向的,
朝着更懂、更优、更精的方向积累。
也就是说,
替你管业务,思路是从旧思路里学的,
而HL的AI是自己学习,自己进化,
按自己的思路在经营。
也就是,人家自己有判断。
如果说工业革命是把的"体力"外包给机器,
AI革命是把"脑力"外包给模型。
AI的成长性强了,这是另一个故事。
而且投资人会对HL这种AI能干什么充满想象。
回归这个概念本身,
我的结论是,
有时候不是"算法突破",
而"维护曲线的改变"。
这篇随笔文章不是技术综述,
提出一个新的范式概念。
它不是论文,没有实验数据,
是基于观察的概念性论证。
HL这个概念,是否会成为业内标准术语,
还要看接下来一两年的发展。
当年,维护屎山规则太难,
就走入死胡同。
不过,coding agent时代,
这条曲线大概率会被改写。



《AI产品和技术模块》
2.搞懂“记忆”必看|吃透Engram,坐等Deepseek新模型
7.排行榜是别人的,手感是自己的:Kimi K2.6体感报告
《具身智能》
《AI+医疗》
4.对话作者:全球首个开源手术视频大模型SurgMotion(第一期)
《AI算力系列》
1.对抗NVLink简史?10万卡争端,英伟达NVL72超节点挑起
3.阿里华为『血战』英伟达AI超节点:悲观者正确,乐观者赚钱
更多推荐


所有评论(0)