张雪峰:一个没有备份的人肉数据库
文 / 一只阿木木
▎ §0 — 事故报告
[INCIDENT REPORT]系统名称:张雪峰(张子彪)首次部署:2008年持续运行:18年数据规模:1000+高校 / 500+专业 / 14学科门类 / 10年+录取数据峰值负载:日均直播6-10h / 月跑72km / 年服务百万家庭冗余节点:0备份策略:无异常预警:2023.06(胸闷 / 心悸 / 强制住院)—— 未处理,恢复后继续满载运行宕机时间:2026.03.24 15:50故障原因:心源性猝死数据可恢复性:0%如果张雪峰是一台服务器,任何一个初级运维都会告诉你——
这个架构,早晚要出事。
▎ §1 — 他最后一天的"请求日志"
3月22日,他发文称当日完成7公里健身打卡,当月累计跑步里程已达72公里。
张雪峰似乎再次报名了无锡马拉松,朋友圈晒出的两天连续跑7公里,似乎就是在为马拉松做热身。但不知道什么原因,今年的无锡马拉松组委会把张雪峰的名额取消了。
然后是3月24日。一个普通的周一。
早上,他照常坐在直播间里,面对镜头,回答家长们关于升学的问题。
中午12:26,他在公司跑步后出现不适。
下午15:50,抢救无效。
张雪峰因心源性猝死全力抢救无效,于2026年3月24日15时50分在苏州逝世。
一切发生在三个半小时之内。
他的个人账号还更新了动态,画面中张雪峰头发已经白了不少。桌子上摆满了外卖盒,都是一些重油重盐,高热量的食物。
他走得太突然了。
傍晚时分,多个直播间出现异常情况。18时05分,小红书账号"张雪峰老师"突然终止了直播。紧接着在18时18分,其抖音矩阵账号"张雪峰讲升学规划"也突然中断了直播。
直播间沉默了。弹幕还在滚动。
一个每天处理上万条"人生该怎么选"的请求的系统,最终没能处理自己的那一条。
▎ §2 — Root Cause Analysis:为什么这台"服务器"注定崩溃?
张雪峰搭建了一个让人叹为观止的知识系统。但它犯了分布式架构设计的第一大忌——
单节点。零冗余。无备份。
我们来拆解这台"服务器"的技术架构。
数据采集层
大四时帮助同寝同学收集考研资料而产生兴趣,大学毕业后加入一家培训机构,坚持近10年在业内小有名气后选择单飞。
18年的手动数据采集。从考研到高考、从就业到考公,全国上千所高校的信息,灌进了一颗大脑。
这不是随便什么人都能建的"数据库"。他对数据质量的要求是变态级的:
新员工入职第一课,是啃下《普通高等学校本科专业目录》——14个学科门类、100多个一级学科、500多个本科专业,一个星期之内随便说一个专业,你必须说出它属于哪个一级学科。
但真正有价值的,不是这些写在目录里的公开信息。而是18年里他用自己的嘴问出来、用自己的脚跑出来、用自己的脑子推出来的隐性知识——
哪些学校的某个专业存在"名不副实"?哪些地方性院校有不为人知的就业优势?哪些专业的官方就业率数据"有水分"?
这些东西,从来没有被写进过任何文档。
它们全部存在一个地方——他的大脑皮层。
计算推理层
张雪峰不是在"查表"。他是在做实时推理。
他一开口就是自带东北人幽默感的口语化风格,能把干得硌牙的报考规则拆解得通俗易懂。
一个家庭的经济条件 × 孩子的性格特点 × 所在省份的竞争格局 × 目标行业的未来趋势 → 输出一个个性化的"最优解"。
这是什么?这是人肉版的RAG——检索增强生成。
只不过,"检索"靠的是他的记忆,"生成"靠的是他的判断,"增强"靠的是他18年的经验积累。所有的计算、推理、输出,全部跑在一颗大脑上。
输出交互层
直播间就是他的API接口。东北口音+段子=用户体验层。
凭借斩钉截铁的结论、直击痛点的调侃、高密度的爆点,张雪峰把升学这件事,做成了适配全网传播的爆款内1容。
日均直播6-10小时。API不限流、不降级、不熔断。
接受所有请求,处理所有query,永远在线,永远满载。
直到,物理硬件承受不住了。
2023年6月24日晚,张雪峰在个人社交平台表示,因为过度劳累、胸闷心悸,被医院收治强制住院。
这是系统发出的第一次critical alert。
然后呢?
但这份"自律"的背后,藏着的却是常年高压的工作状1态。他恢复后继续满载运行。alert被ignore了。
任何一个写过高可用系统的工程师都知道:所有读写请求全部打到一个节点上,没有负载均衡,没有故障转移,没有灾备方案。这不是"如果"会崩——而是"什么时候"崩。
答案是:2026年3月24日,中午。
▎ §3 — 什么数据随他一起消失了?
我想让你看一张表:
知识类型 | 举例 | 可恢复性 |
显性数据(结构化) | 各高校录取分数线、专业设置、招生计划 | ✅ 公开可查,AI已覆盖 |
经验规则(半结构化) | “这个分数段在这个省报这个学校,大概率能录” | ⚠️ 部分可从团队还原 |
隐性判断(非结构化) | “这个孩子性格内向、家在小城市,适合A而非B” | ❌ 随人消失 |
行业直觉(无法编码) | 对某些高校内部变化的"嗅觉"、对就业市场的趋势预感 | ❌ 永久丢失 |
表格中间两行——那些灰色地带的、半经验半直觉的知识——才是张雪峰真正值钱的东西。
2024年高考前夕,该公司推出的售价11999元的"志愿梦想卡"和17999元的"志愿圆梦卡"等产品一度售罄,供不应求。
家长们花近两万块买的,不是一张"分数线对照表"。那种东西百度免费。他们买的是张雪峰脑子里那些无法被结构化的判断力。
而现在,这个"判断引擎"永久下线了。
值得注意的是,张雪峰相对退居幕后,可服务老师皆是张雪峰团队随机分配,且不接受7天无理由退款。
也就是说,后端服务团队早已存在。但家长们为什么仍然愿意付18999?因为他们相信的不是团队,是张雪峰这个人。
当这个人"宕机",信任链条断了。数据没了。判断力没了。
18年的隐性知识积累,在一个周一的中午,归零了。
你可能会说——还有团队呢?还有公司呢?
该公司成立于2021年,注册资本1000万元,目前员工约350人。
350人的团队,9家存续公司,横跨教育、旅游、电商、创投。张雪峰关联11家企业(9家存续),涉足教育、旅游、文化传播等行业,担任苏州峰学蔚来等9家公司法定代表人。
这个帝国看起来庞大。但它有一个致命的架构缺陷——
前端全部绑在一个人身上。后端再强,没有前端的流量和信任灌注,也只是空转。
三个月后就是2026年高考季。没有张雪峰的直播引流,18999元的圆梦卡还卖得动吗?
这不是一个商业问题。这是一个架构问题。
▎ §4 — 不只是张雪峰:你也在"裸奔"
张雪峰不是特例。
他只是中国式知识工作者的极端缩影。
你身边到处都是"人肉数据库"——
你是一个运营,脑子里记着200个KOL的调性、报价、合作禁忌。这些写在任何交接文档里了吗?
你是一个销售,知道每个大客户的决策链条、关键人的喜好、报价的弹性空间。如果你明天离职,下一个人能接住吗?
你是一个技术负责人,整个系统哪里有坑、哪段代码不能碰、哪个接口有隐藏的依赖关系——全在你脑子里。新人接手要踩多少遍?
你是一个自媒体博主,选题直觉、用户洞察、平台算法的"体感"——这些"经验"能传给任何人吗?
你可能觉得"我没有张雪峰那么重要"。
但对你的团队、你的家庭、你的客户来说——你就是他们的单点故障。
你请一次长假,事情就转不动了。这不是你的"不可替代性",这是你的系统架构有bug。
张雪峰至少还有一个350人的团队来善后。
你呢?
▎§5 — Migration Plan:从"人肉硬扛"到"AI第二大脑"
我不想开"事后诸葛亮"的药方。张雪峰老师已经走了,说什么都晚了。
但我想给每一个正在用"人肉模式"运行的知识工作者——包括我自己——提供一份系统迁移方案。
这是一个后端程序员的本能:系统出了事故,先写复盘,再出修复方案。
text
旧架构(张雪峰模式):用户请求 → [人脑] → 人肉输出 ↑ 单点故障 ↑ 无法水平扩展 ↑ 宕机 = 全局不可用新架构(AI第二大脑模式):用户请求 → [AI知识引擎] ├─ 结构化知识库(显性数据+经验规则) ├─ 大模型推理(基于个人知识的RAG) └─ 人类专家审核(20%关键决策) ↑ 持续写入:人类专家的隐性知识外化三步迁移,从今天开始:
Step 1:Capture(知识捕获)—— 把脑子里的东西dump出来
不是"写文档"那种形式主义。
而是:每次你做一个判断的时候,花30秒,录一段音,说清楚"我为什么这样决定"。
- 为什么这个客户要用方案A而不是方案B?
- 为什么这个选题我直觉上觉得不行?
- 为什么这段代码我选择了这个实现方式?
用语音转文字工具自动记录,再用AI提炼出决策逻辑。
关键不是记录"结论",而是记录**“判断过程”**。结论会过时,判断逻辑不会。
Step 2:Structure(知识结构化)—— 从碎片到知识图谱
把日常积累的散落经验、判断、案例,整理成可检索、可关联的知识库。
不需要多复杂。一个Notion数据库、一个Obsidian知识图谱,甚至一个结构化的备忘录——只要它不是"只存在你脑子里"就行。
然后用RAG技术,让AI可以"读懂"和"调用"你的知识。
关键不是"存储",而是让知识**“可推理”**——AI不仅能检索到你记过的东西,还能基于你的知识体系做出推断。
Step 3:Activate(知识激活)—— 让知识库"活"起来
基于你的个人知识库,搭建一个AI助手。
它可以自动回答80%的常见问题——那些重复性的、有标准答案的、只需要"查表"的请求。
而你,只需要介入那最关键的20%——真正需要人类经验、直觉和判断力的部分。
AI不是替代你。AI是让你从"7×24小时在线"变成"只在关键时刻在线"。
回到张雪峰——
如果他三年前开始做这三步,今天的结果会不同吗?
我不知道他的心脏能不能被挽救。但我知道——
他的团队今天就不会面对一个"前端归零"的困境。他的18年经验不会随心跳停止而消失。那些付了18999元的家长,依然可以获得"张雪峰级别"的决策支持。
而他自己,也许不需要每天直播10小时,不需要每一个请求都亲自处理,不需要把自己活成一台永不停机的服务器。
他可以喘口气。他可以真的去跑步,而不是带着一颗过载的心脏在跑步机上冲刺。
但他没做。所以今天,一切归零了。
▎ §6 — 永远不要在没有备份的节点上跑你的系统
张雪峰用18年搭建了一个价值数十亿的知识系统。
然后因为没有做备份,在一个普通的周一中午,永久宕机了。
你的脑子里,也跑着一个"数据库"。
它可能没有张雪峰那么大,但对依赖你的人来说,它同样不可替代。
如果你明天宕机了,谁来恢复你的数据?
从今天开始,给你的知识做一次备份。
不是为了追风口。不是为了提效率。
而是为了——万一有一天你不在了,你最有价值的东西,还在。
这是一个后端程序员能给你最诚恳的忠告:
永远不要把你的系统,跑在一个没有备份的节点上。
张雪峰老师,一路走好。
而你,还来得及。
