凌晨3点被电话叫醒处理线上故障,修完bug发现是产品经理测试环境误操作,算一笔账,oncall到底让程序员付出了什么代价

张开发
2026/4/8 8:18:44 15 分钟阅读

分享文章

凌晨3点被电话叫醒处理线上故障,修完bug发现是产品经理测试环境误操作,算一笔账,oncall到底让程序员付出了什么代价
凌晨3点被oncall电话吵醒从床上爬起来打开电脑VPN连上查日志定位问题改代码发版本验证修复……折腾了一个半小时终于搞定了。然后产品经理在群里发了一句不好意思刚才我在测试环境误操作了已经回滚了。你说气不气更气的是第二天上班没人会问你昨晚睡得好不好。领导照样9点开会产品照样催需求测试照样提bug。好像你昨晚的一个半小时根本不存在一样。oncall的成本从来不只是那一个半小时很多人觉得oncall嘛就是偶尔半夜被叫醒处理个问题一个月也就一两次能有多大影响影响大了去了。咱们算笔账。第一笔账睡眠成本。凌晨3点被叫醒处理到4点半。你以为你4点半躺下就能继续睡不可能的。你的大脑还在高速运转回想刚才的操作有没有遗漏担心会不会又出问题。心跳还没平复肾上腺素还在分泌。真正能睡着至少得5点以后。7点闹钟响了你得起床上班。算下来你这一晚上只睡了4-5个小时而且是碎片化的睡眠。第二天你会怎么样头晕、注意力不集中、反应变慢、情绪烦躁。写代码容易出错开会容易走神。一次oncall毁掉的不只是一晚上的睡眠是第二天整整8小时的工作效率。第二笔账心理成本。更可怕的不是被叫醒那一次而是你知道自己随时可能被叫醒。oncall期间你不敢喝酒不敢看电影不敢离手机太远。睡觉的时候手机放在枕头边音量开到最大生怕漏接电话。这种状态叫什么叫待命。你以为你在休息其实你的神经一直紧绷着。有oncall经历的人都懂那一周你的生活质量会断崖式下跌。周末不敢出远门晚上不敢睡太死每次手机响都会心跳加速。说白了oncall期间你的私人时间根本不属于你自己。第三笔账经济成本。很多公司oncall是有补贴的对吧一周给你200块、500块。听起来还行咱们算算一周oncall假设被叫醒2次每次损失3小时睡眠包括处理时间重新入睡时间一周就是6小时。你月薪3万按22天工作日算时薪大概170块。6小时就是1000块。公司给你500块oncall补贴你亏了500块。而且这还没算上第二天工作效率下降的损失没算上心理压力的代价没算上周末不能出门的机会成本。说句扎心的话oncall补贴根本不够补偿你的付出。更荒诞的是很多oncall根本不该发生回到开头那个故事。凌晨3点被叫醒折腾一个半小时最后发现是产品经理测试环境误操作。这种事有多常见太常见了。我见过的oncall故障里至少30%是可以避免的测试环境和生产环境没分清楚发版前没做充分测试监控告警阈值设置不合理误报某个同事手滑执行了错误的脚本说白了很多oncall不是技术问题是管理问题。但最后买单的永远是那个被叫醒的程序员。如果你正在oncall至少做到这两点说了这么多不是让你拒绝oncall——很多公司这是硬性要求你拒绝不了。但至少可以做到这两点第一争取合理的补偿。如果公司oncall补贴太低或者根本没有你得主动提。不是闹是谈。领导oncall这事我理解是工作需要但确实对生活影响挺大的。咱们能不能在补贴上做点调整或者oncall后第二天能不能晚点到合理的诉求大大方方提出来。第二推动减少无效oncall。每次oncall后记录下来什么问题、怎么解决的、能不能避免。如果是误报、误操作这种低级错误在复盘会上提出来。不是甩锅是改进流程。这次是测试环境误操作导致的能不能加个二次确认或者测试环境和生产环境的操作权限分开能减少一次无效oncall就是给自己省一次折腾。……最后说一句。oncall这件事最让人无奈的地方在于——它把你的生活变成了待命状态。你不知道什么时候会响但你知道它一定会响。这种感觉就像头上悬着一把剑不知道什么时候掉下来但你得一直盯着。如果你正在经历这种状态记得照顾好自己。该休息就休息该提诉求就提诉求该跳槽就跳槽。没有任何一份工作值得你用健康和生活质量去换。共勉。

更多文章