Loading...
最近家里的树莓派集群经常有节点莫名其妙的挂掉了,是彻底的挂掉了。然后也不会自动重启,就是连不上。集群中的一些 Pod 无法执行。分析了一下,挂掉的节点就是自己用来做 gitlab CI/CD 执行机的机器。而且是挂在了内存耗尽上。在资源不足的情况下,树莓派选择了假死🤦♀️。这样的话就不能把 CI/CD 这种任务放在这个机器上了。而后扩展一下,想到了后端你的生产环境和测试环境隔离的事情。这也...
研究了半天 Promuthus 巴拉巴拉,最后直接使用https://github.com/carlosedp/cluster-monitoring进行安装即可。