使用kube-prometheus监控k8s
使用kube-prometheus部署k8s监控(最新版)-腾讯云开发者社区-腾讯云 (tencent.com)
查看官方的版本对应关系

但是我们公司的集群有一些比较老,还是1.18的

找到了一个以前的对应表。
决定安装release-0.6的版本
1 | git clone https://github.com/prometheus-operator/kube-prometheus.git |
增加存储配置
kube-prometheus\manifests\prometheus-prometheus.yaml
1 | ... |
kube-prometheus\manifests\grafana-deployment.yaml
1 | volumes: |
创建对应的grafana-data pvc
1 | kind: PersistentVolumeClaim |
安装
1 | kubectl apply -f manifests/setup |
修复kube-scheduler和controller-manager监控异常问题


原本三个都是down的状态。我已经修复了一个。
原因是kube-scheduler和controller-manager部署的时候配置的bind-address是127.0.0.1
现在我们用主机的ip去连,自然是不会成功的。
修改一下bind-address为0.0.0.0就好了

我的kube-scheduler和controller-manager都是静态pod
修改后,从/etc/kubernetes/manifests/移出,稍等几秒再移进来就可以了