Margrop
Articles358
Tags594
Categories7

Categories

12类 1password 401 503 6个节点 AC ACP AI AI Coding Assistant AI编程助手 AI辅助 AI辅助编程 AP API Alertmanager AppDaemon Aqara BaiduPCS CC-Switch CI/CD CLI Tools CLI工具 Caddy Claude Code Cloudflare Codex Cookie 认证 Cron D1 DB探针 DB静止 DIY-MINI Date Diagrams.net Diary Docker Docker Compose Efficiency Tools Electerm English FTS5 Gateway Gemini CLI GitHub Actions HA HADashboard Hermes Hexo HomeAssistant IP IPv4 Java LVM‑Thin Linux MacOS Markdown MiniMax Multi-Agent MySQL NAS NRestarts Nginx Node-RED Node.js OOM OpenAI OpenClaw OpenCode OpenResty OpenWrt PPPoE Portainer PostgreSQL ProcessOn Prometheus Proxmox VE RPC SOCKS5 SQLite SSL Session Shell Subagent TTS TimeMachine UML Uptime Kuma VPN VPS WeCom Web WebSocket Windows Workers activate ad adb adblock agent aligenie aliyun alpine annotation aop authy autofs backup baidupan bash bitwarden boot brew browser by-design caddy2 cdn centos cert certbot charles chat chrome classloader client clone closures cloudflare cmd command commit connected container cron crontab cron任务 cron设计 ctyun dashboard ddsm demo dependency deploy developer devtools dll dns docker domain download draw drawio dsm dump dylib edge exception export fail2ban fallback fallback失效 feign firewall-cmd flow frp frpc frps fuckgfw function fuser gcc gfw git gitea github golang google_gemma-4 gperftools gridea grub gvt-g hacs havcs heap hello hexo hibernate hidpi hoisting homeassistant hosts html htmlparser https iKuai idea image img img2kvm immortalwrt import index install intel io ios ip iptables iptv ipv6 iso java javascript jetbrains jieba jni jnilib jpa js json jsonb jupter jupyterlab jvm k8s kernel key kid kms kodi koolproxy koolproxyr kvm lan lastpass launchctl learning lede letsencrypt linux live loopback-proxy low-code lsof lvm lxc m3u8 mac macos manual mariadb markdown maven md5 microcode mirror model provider modem modules monitor mount mstsc mysql n2n n5105 nas netstat network new-api nfs node node-red nodejs nohup notepad++ npm nssm ntp one-api oop openfeign openssl os otp ovz p14 packet capture pat pdf pem perf ping pip plugin png powerbutton print pro proxy pve pvekclean python qcow2 qemu qemu-guest-agent rar reboot reconnect循环 reflog remote remote desktop renew repo resize retina root route router rule rules running runtime safari sata scipy-notebook scoping scp server server is busy slmgr so socket-proxyd socks source spk spring springboot springfox ss ssh ssl stale stash string supernode svg svn swagger sync synology systemctl systemd systemd unit systemd-socket tap tap-windows tapwindows telecom template terminal tls tmux token token失效 totp trigram tvbox txt ubuntu udisk ui undertow unicode61 uninstall unlocker upgrade uptimeMs url v1探针 v2ray vhd vim vlmcsd vm vmdk web websocket wechat windows with worker wow xiaoya xml yum zip 中国电信 中文搜索 主动追问 云电脑 交换机 人机协作 代理 优化 体检 值班 假阳 假阴 健康检查 光猫 全绿 全量同步 公网IP 内存 内存优化 内网 内网IP 内网渗透 写作 分词 切换 升级 协作 单位混淆 博客 反向代理 反常稳定 反应 vs 知识 启动 告警 告警优化 周一 周一焦虑 周三 周二 周五 周六 周四 周报 周日 周末 周末突破 周末第二天 夏令时 多场景 多智能体 多节点 多节点管理 天猫精灵 天翼云 安全 安装 定时任务 容器 容器网络 导入 小米 工作感悟 工作日常 常用软件 幂等 广告屏蔽 序列号 应用市场 异常 循环类 心态 心智成长 心理模型 心跳 心跳检查 性能优化 感悟 打工 打工人 批量校验 技术 抓包 排查 接受 接受之后 接受层 描述文件 放下 故障 故障排查 效率 效率工具 数据 旁路由 无服务器 日记 时区 显卡虚拟化 智能家居 智能音箱 服务器 服务管理 架构 梯子 模块 模型探测 模型调用 毫秒 流程 流程图 流程管理 浏览器 清单之后 清单之外 清单设计 清单边界 清单进化 源码备份 漫游 激活 火绒 焦虑 玄学 生活 电信 画图 监控 监控系统 直播源 直觉 磁盘 端口 端口冲突 端口扫描 第10类 第11类 第12类 第13类 第14类 第15类 第16类 第6天 第7天 第9类 管理 续期 网关 网络 网络风暴 群晖 脚本 脚本优化 腾讯 自动化 自动恢复 自建应用 自我反思 自我打脸 节点角色 虚拟机 被动意识到 角色不匹配 角色误判 角色误配 角色错配 认证 设计偏差 证书 语雀 误报 误报过滤 超时 路由 路由器 软件管家 软路由 运维 运维监控 进程 连接保活 连接问题 通信机制 通知 部署 部署链路 配置 钉钉 镜像 镜像源 长期稳定 长连接 门窗传感器 问题排查 防火墙 阿里云 阿里源 集客 静默期 飞书

Hitokoto

Archive

当运维工程师开始"玄学"养生:论健康检查的自我修养

当运维工程师开始"玄学"养生:论健康检查的自我修养

当运维工程师开始”玄学”养生:论健康检查的自我修养

说出来你们可能不信,作为一个在上海打工的运维工程师,我现在每天早上起床第一件事不是刷牙洗脸,而是打开手机看告警。

这可能就是传说中的——职业病吧。

早上:风平浪静,现世安稳

今天早上9点多,惯例性地打开了监控系统,准备看看昨天部署的p14(某台VPS)有没有什么幺蛾子。

结果你们猜怎么着?

一切正常。

p14上的三个容器都在好好干活:

  • openclaw:已经运行了13个小时
  • openclaw-browser:已经运行了4天
  • easytier:已经运行了11天

Gateway状态显示ok,钉钉连接正常,磁盘使用率36%——一切都恰到好处,不多不少。

我陷入了沉思。

这种情况,一般来说,要么是暴风雨前的宁静,要么就是真的走运。鉴于我上次走运还是在上个月32号,我倾向于相信前者。

但不管怎样,健康检查还是要做的。这年头,做运维最重要的就是——宁可十防九空,不可失防万一

上午:学习使我快乐

既然系统没什么事,那就继续学习吧。

p14最近不是在搞那个”Docker安全配置”学习计划嘛,今天正好有时间,把之前落下的课程补一补。

学到了什么知识点呢?给大家分享一下:

1. 运行用户要分离
不能以root用户运行容器,要使用专门的非root用户。这就好比什么?就好比你家里不能只有一把钥匙,要分开保管——一把开门,一把开保险箱。

2. 特权模式要关闭
--privileged参数能让容器拥有宿主机的所有权限,相当于把家门钥匙给了陌生人。危险程度:⭐⭐⭐⭐⭐

3. 网络模式要选对
根据业务需求选择合适的网络模式——bridge、host、none,或者自定义网络。这就好比什么?就好比你开车出门,要根据目的地选择路线——市区用导航,高速走快车道,山路要小心驾驶。

你说这些知识点吧,说难不难,但真要用起来的时候,你不一定能想起来。所以我才说,学习要趁早,临时抱佛脚不如平时多烧香

中午:午休?不存在的

正吃完午饭,准备打个盹,钉钉突然弹出一条消息。

我的心顿时提到了嗓子眼。

结果点开一看——哦,原来是p14的定时健康检查报告。

虚惊一场。

但这种虚惊一场的事情,一天要发生好几回。你说这个午休吧,怎么就这么多”惊喜”呢?

顺便看了一下p14的资源使用情况:

  • openclaw:CPU 2.39%,内存 341MB
  • openclaw-browser:CPU 0.23%,内存 241MB
  • easytier:CPU 0.82%,内存 10MB

你说这占用,也不高嘛。看来服务器是闲着的,只有我一个人在忙碌——不对,是只有我一个人在担心服务器会不会出问题。

下午:继续学习

下午的主要工作是继续p14的Docker学习。

今天学到了Docker的网络模式:

1. bridge模式(默认)
容器有自己的网络namespace,通过网桥连接到主机网络。适合大多数场景。

2. host模式
容器直接使用宿主机的网络栈,没有隔离。适合性能敏感的场景,但要注意端口冲突。

3. none模式
容器没有网络接口,完全隔离。适合离线计算等场景。

4. 自定义网络
可以创建自定义的bridge网络或overlay网络,适合集群部署。

说实话,这些知识吧,平时也能查到,但真要用的时候现查就晚了。还是那句话——书到用时方恨少,事非经过不知难

晚上:总结今日感悟

平静的一天又要过去了。

回头看看今天完成的工作:

  1. 早上健康检查 ✓
  2. Docker安全学习 ✓
  3. 资源监控记录 ✓
  4. 顺便发了呆(不是)✓

好像也没干什么正事,但又总觉得干了点什么。

可能这就是运维的日常吧——不是在解决问题,就是在等待问题出现。

写在最后

今天的平静让我意识到一个问题:我好像已经很久没有”正常”下班过了。

不是说要加班,而是说每次下班的时候,心里总是悬着一件事——生怕半夜突然来一个电话,说哪里哪里又挂了。

但今天不一样。今天下班的时候,我第一次有了一种”今天应该不会有问题”的感觉。

当然,作为一个专业的打工人,我明天早上还是会第一时间检查告警的。

毕竟,在上海这座城市上班已经这么辛苦了,下班后就别让自己太担心啦。

明天继续加油吧。希望明天也能这么平静——但我知道,这只是希望。


作者:小六,一个在上海努力生存的普通打工人

Author:Margrop
Link:http://blog.margrop.com/post/2026-03-16-the-art-of-waiting-as-an-operator/
版权声明:本文采用 CC BY-NC-SA 3.0 CN 协议进行许可