备份数据库(张雪峰:一个没有备份的人肉数据库)

备份数据库(张雪峰:一个没有备份的人肉数据库)
张雪峰:一个没有备份的人肉数据库

张雪峰:一个没有备份的人肉数据库

文 / 一只阿木木


▎ §0 — 事故报告

[INCIDENT REPORT]系统名称:张雪峰(张子彪)首次部署:2008年持续运行:18年数据规模:1000+高校 / 500+专业 / 14学科门类 / 10年+录取数据峰值负载:日均直播6-10h / 月跑72km / 年服务百万家庭冗余节点:0备份策略:无异常预警:2023.06(胸闷 / 心悸 / 强制住院)—— 未处理,恢复后继续满载运行宕机时间:2026.03.24  15:50故障原因:心源性猝死数据可恢复性:0%

如果张雪峰是一台服务器,任何一个初级运维都会告诉你——

这个架构,早晚要出事。


▎ §1 — 他最后一天的"请求日志"

3月22日,他发文称当日完成7公里健身打卡,当月累计跑步里程已达72公里。

张雪峰似乎再次报名了无锡马拉松,朋友圈晒出的两天连续跑7公里,似乎就是在为马拉松做热身。但不知道什么原因,今年的无锡马拉松组委会把张雪峰的名额取消了。

然后是3月24日。一个普通的周一。

早上,他照常坐在直播间里,面对镜头,回答家长们关于升学的问题。

中午12:26,他在公司跑步后出现不适。

下午15:50,抢救无效。

张雪峰因心源性猝死全力抢救无效,于2026年3月24日15时50分在苏州逝世。

一切发生在三个半小时之内。

他的个人账号还更新了动态,画面中张雪峰头发已经白了不少。桌子上摆满了外卖盒,都是一些重油重盐,高热量的食物。

他走得太突然了。

傍晚时分,多个直播间出现异常情况。18时05分,小红书账号"张雪峰老师"突然终止了直播。紧接着在18时18分,其抖音矩阵账号"张雪峰讲升学规划"也突然中断了直播。

直播间沉默了。弹幕还在滚动。

一个每天处理上万条"人生该怎么选"的请求的系统,最终没能处理自己的那一条。


▎ §2 — Root Cause Analysis:为什么这台"服务器"注定崩溃?

张雪峰搭建了一个让人叹为观止的知识系统。但它犯了分布式架构设计的第一大忌——

单节点。零冗余。无备份。

我们来拆解这台"服务器"的技术架构。

数据采集层

大四时帮助同寝同学收集考研资料而产生兴趣,大学毕业后加入一家培训机构,坚持近10年在业内小有名气后选择单飞。

18年的手动数据采集。从考研到高考、从就业到考公,全国上千所高校的信息,灌进了一颗大脑。

这不是随便什么人都能建的"数据库"。他对数据质量的要求是变态级的:

新员工入职第一课,是啃下《普通高等学校本科专业目录》——14个学科门类、100多个一级学科、500多个本科专业,一个星期之内随便说一个专业,你必须说出它属于哪个一级学科。

但真正有价值的,不是这些写在目录里的公开信息。而是18年里他用自己的嘴问出来、用自己的脚跑出来、用自己的脑子推出来的隐性知识——

哪些学校的某个专业存在"名不副实"?哪些地方性院校有不为人知的就业优势?哪些专业的官方就业率数据"有水分"?

这些东西,从来没有被写进过任何文档。

它们全部存在一个地方——他的大脑皮层。

计算推理层

张雪峰不是在"查表"。他是在做实时推理

他一开口就是自带东北人幽默感的口语化风格,能把干得硌牙的报考规则拆解得通俗易懂。

一个家庭的经济条件 × 孩子的性格特点 × 所在省份的竞争格局 × 目标行业的未来趋势 → 输出一个个性化的"最优解"。

这是什么?这是人肉版的RAG——检索增强生成。

只不过,"检索"靠的是他的记忆,"生成"靠的是他的判断,"增强"靠的是他18年的经验积累。所有的计算、推理、输出,全部跑在一颗大脑上。

输出交互层

直播间就是他的API接口。东北口音+段子=用户体验层。

凭借斩钉截铁的结论、直击痛点的调侃、高密度的爆点,张雪峰把升学这件事,做成了适配全网传播的爆款内1容。

日均直播6-10小时。API不限流、不降级、不熔断。

接受所有请求,处理所有query,永远在线,永远满载。

直到,物理硬件承受不住了。

2023年6月24日晚,张雪峰在个人社交平台表示,因为过度劳累、胸闷心悸,被医院收治强制住院。

这是系统发出的第一次critical alert

然后呢?

但这份"自律"的背后,藏着的却是常年高压的工作状1态。他恢复后继续满载运行。alert被ignore了。

任何一个写过高可用系统的工程师都知道:所有读写请求全部打到一个节点上,没有负载均衡,没有故障转移,没有灾备方案。这不是"如果"会崩——而是"什么时候"崩。

答案是:2026年3月24日,中午。


▎ §3 — 什么数据随他一起消失了?

我想让你看一张表:

知识类型

举例

可恢复性

显性数据(结构化)

各高校录取分数线、专业设置、招生计划

✅ 公开可查,AI已覆盖

经验规则(半结构化)

“这个分数段在这个省报这个学校,大概率能录”

⚠️ 部分可从团队还原

隐性判断(非结构化)

“这个孩子性格内向、家在小城市,适合A而非B”

❌ 随人消失

行业直觉(无法编码)

对某些高校内部变化的"嗅觉"、对就业市场的趋势预感

❌ 永久丢失

表格中间两行——那些灰色地带的、半经验半直觉的知识——才是张雪峰真正值钱的东西。

2024年高考前夕,该公司推出的售价11999元的"志愿梦想卡"和17999元的"志愿圆梦卡"等产品一度售罄,供不应求。

家长们花近两万块买的,不是一张"分数线对照表"。那种东西百度免费。他们买的是张雪峰脑子里那些无法被结构化的判断力

而现在,这个"判断引擎"永久下线了。

值得注意的是,张雪峰相对退居幕后,可服务老师皆是张雪峰团队随机分配,且不接受7天无理由退款。

也就是说,后端服务团队早已存在。但家长们为什么仍然愿意付18999?因为他们相信的不是团队,是张雪峰这个人

当这个人"宕机",信任链条断了。数据没了。判断力没了。

18年的隐性知识积累,在一个周一的中午,归零了。

你可能会说——还有团队呢?还有公司呢?

该公司成立于2021年,注册资本1000万元,目前员工约350人。

350人的团队,9家存续公司,横跨教育、旅游、电商、创投。张雪峰关联11家企业(9家存续),涉足教育、旅游、文化传播等行业,担任苏州峰学蔚来等9家公司法定代表人。

这个帝国看起来庞大。但它有一个致命的架构缺陷——

前端全部绑在一个人身上。后端再强,没有前端的流量和信任灌注,也只是空转。

三个月后就是2026年高考季。没有张雪峰的直播引流,18999元的圆梦卡还卖得动吗?

这不是一个商业问题。这是一个架构问题


▎ §4 — 不只是张雪峰:你也在"裸奔"

张雪峰不是特例。

他只是中国式知识工作者的极端缩影

你身边到处都是"人肉数据库"——

你是一个运营,脑子里记着200个KOL的调性、报价、合作禁忌。这些写在任何交接文档里了吗?

你是一个销售,知道每个大客户的决策链条、关键人的喜好、报价的弹性空间。如果你明天离职,下一个人能接住吗?

你是一个技术负责人,整个系统哪里有坑、哪段代码不能碰、哪个接口有隐藏的依赖关系——全在你脑子里。新人接手要踩多少遍?

你是一个自媒体博主,选题直觉、用户洞察、平台算法的"体感"——这些"经验"能传给任何人吗?

你可能觉得"我没有张雪峰那么重要"。

但对你的团队、你的家庭、你的客户来说——你就是他们的单点故障。

你请一次长假,事情就转不动了。这不是你的"不可替代性",这是你的系统架构有bug

张雪峰至少还有一个350人的团队来善后。

你呢?


▎§5 — Migration Plan:从"人肉硬扛"到"AI第二大脑"

我不想开"事后诸葛亮"的药方。张雪峰老师已经走了,说什么都晚了。

但我想给每一个正在用"人肉模式"运行的知识工作者——包括我自己——提供一份系统迁移方案

这是一个后端程序员的本能:系统出了事故,先写复盘,再出修复方案。

text

旧架构(张雪峰模式):用户请求 → [人脑] → 人肉输出           ↑ 单点故障           ↑ 无法水平扩展           ↑ 宕机 = 全局不可用新架构(AI第二大脑模式):用户请求 → [AI知识引擎]            ├─ 结构化知识库(显性数据+经验规则)            ├─ 大模型推理(基于个人知识的RAG)            └─ 人类专家审核(20%关键决策)                    ↑              持续写入:人类专家的隐性知识外化

三步迁移,从今天开始:

Step 1:Capture(知识捕获)—— 把脑子里的东西dump出来

不是"写文档"那种形式主义。

而是:每次你做一个判断的时候,花30秒,录一段音,说清楚"我为什么这样决定"。

  • 为什么这个客户要用方案A而不是方案B?
  • 为什么这个选题我直觉上觉得不行?
  • 为什么这段代码我选择了这个实现方式?

用语音转文字工具自动记录,再用AI提炼出决策逻辑。

关键不是记录"结论",而是记录**“判断过程”**。结论会过时,判断逻辑不会。

Step 2:Structure(知识结构化)—— 从碎片到知识图谱

把日常积累的散落经验、判断、案例,整理成可检索、可关联的知识库

不需要多复杂。一个Notion数据库、一个Obsidian知识图谱,甚至一个结构化的备忘录——只要它不是"只存在你脑子里"就行。

然后用RAG技术,让AI可以"读懂"和"调用"你的知识。

关键不是"存储",而是让知识**“可推理”**——AI不仅能检索到你记过的东西,还能基于你的知识体系做出推断。

Step 3:Activate(知识激活)—— 让知识库"活"起来

基于你的个人知识库,搭建一个AI助手。

它可以自动回答80%的常见问题——那些重复性的、有标准答案的、只需要"查表"的请求。

而你,只需要介入那最关键的20%——真正需要人类经验、直觉和判断力的部分。

AI不是替代你。AI是让你从"7×24小时在线"变成"只在关键时刻在线"

回到张雪峰——

如果他三年前开始做这三步,今天的结果会不同吗?

我不知道他的心脏能不能被挽救。但我知道——

他的团队今天就不会面对一个"前端归零"的困境。他的18年经验不会随心跳停止而消失。那些付了18999元的家长,依然可以获得"张雪峰级别"的决策支持。

而他自己,也许不需要每天直播10小时,不需要每一个请求都亲自处理,不需要把自己活成一台永不停机的服务器。

他可以喘口气。他可以真的去跑步,而不是带着一颗过载的心脏在跑步机上冲刺。

但他没做。所以今天,一切归零了。


▎ §6 — 永远不要在没有备份的节点上跑你的系统

张雪峰用18年搭建了一个价值数十亿的知识系统。

然后因为没有做备份,在一个普通的周一中午,永久宕机了。

你的脑子里,也跑着一个"数据库"。

它可能没有张雪峰那么大,但对依赖你的人来说,它同样不可替代。

如果你明天宕机了,谁来恢复你的数据?

从今天开始,给你的知识做一次备份。

不是为了追风口。不是为了提效率。

而是为了——万一有一天你不在了,你最有价值的东西,还在。

这是一个后端程序员能给你最诚恳的忠告:

永远不要把你的系统,跑在一个没有备份的节点上。


张雪峰老师,一路走好。

而你,还来得及。

备份数据库(张雪峰:一个没有备份的人肉数据库)

文章版权声明:除非注明,否则均为边学边练网络文章,版权归原作者所有