Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

04-09 1587阅读

Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

  • 1、节点健康检查
    • 1.1、使用 kubectl 查看节点状态
    • 1.2、查看节点详细信息
    • 1.3、检查节点资源使用情况
    • 2、Pod 健康检查
      • 2.1、 使用 kubectl 查看 Pod 状态
      • 2.2、 查看特定 Pod 的详细信息,包括事件和条件
      • 3、服务健康检查
        • 3.1、使用 kubectl 查看服务状态
        • 3.2、查看特定服务的详细信息,包括端口和端点
        • 4、使用 kubectl 查看存储状态
        • 5、集群组件健康检查
        • 6、使用 Kubernetes Dashboard 进行综合监控

          💖The Begin💖点点关注,收藏不迷路💖

          在使用 Kubernetes(k8s)部署应用程序时,保证集群的健康状态至关重要。通过定期的健康检查,可以及时发现并解决可能导致应用程序中断或故障的问题,确保集群的稳定性和可靠性。

          1、节点健康检查

          1.1、使用 kubectl 查看节点状态

          [root@k8s-master ~]# kubectl get nodes
          NAME         STATUS   ROLES           AGE     VERSION
          k8s-master   Ready    control-plane   10m     v1.24.1
          k8s-node01   Ready              8m9s    v1.24.1
          k8s-node02   Ready              5m48s   v1.24.1
          [root@k8s-master ~]#
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          将列出所有节点的状态,包括节点的名称、状态、版本等信息。确保所有节点都处于 Ready 状态,表示节点正常运行且可用。

          1.2、查看节点详细信息

          使用kubectl describe nodes 命令来查看特定节点的详细信息。

          kubectl describe nodes 
          [root@k8s-master ~]# kubectl describe nodes k8s-node01
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          节点基本信息:节点的名称、标签、操作系统、架构等基本信息。

          节点资源信息:节点的CPU、内存、存储等资源使用情况。

          节点条件:节点的健康状态、是否Ready等条件。

          节点事件:与节点相关的事件和警告信息。

          容器运行时信息:节点上正在运行的容器运行时信息。

          Pod信息:在节点上运行的Pod的详细信息。

          网络信息:节点的网络配置和状态信息。

          1.3、检查节点资源使用情况

          kubectl top nodes
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          2、Pod 健康检查

          2.1、 使用 kubectl 查看 Pod 状态

          ##查看所有命名空间中的 Pod 状态
          kubectl get pods --all-namespaces
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          列出所有命名空间中的 Pod 状态,包括 Pod 的名称、所属命名空间、状态、就绪状态、重启次数等信息。确保所有 Pod 都处于 Running 状态,并且就绪状态为 1/1,表示 Pod 正常运行且没有异常。

          2.2、 查看特定 Pod 的详细信息,包括事件和条件

          kubectl describe pod  -n 
          kubectl describe pod dashboard-metrics-scraper-8c47d4b5d-jzqhn -n kubernetes-dashboard
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          如果 Pod 处于 Running 状态,则表示 Pod 健康;如果 Pod 处于 Pending 或 Failed 状态,则可能存在问题。

          3、服务健康检查

          3.1、使用 kubectl 查看服务状态

          kubectl get services --all-namespaces
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          列出所有命名空间中的服务状态,包括服务的名称、类型、ClusterIP、外部端点等信息。确保所有服务都处于正常状态,可以正常访问和提供服务。

          3.2、查看特定服务的详细信息,包括端口和端点

          kubectl describe svc  -n  
          kubectl describe svc dashboard-metrics-scraper -n kubernetes-dashboard
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          4、使用 kubectl 查看存储状态

          kubectl get pv,pvc --all-namespaces
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          列出所有命名空间中的持久卷(PersistentVolume)和持久卷声明(PersistentVolumeClaim)的状态,包括名称、状态、容量、访问模式等信息。确保存储系统正常工作,PV 和 PVC 的状态为 Bound 表示正常绑定。

          ## 查看详细信息
          kubectl describe pv  
          kubectl describe pvc  -n  
          

          5、集群组件健康检查

          查看 Kubernetes 系统命名空间中各个组件的状态,例如 kube-scheduler、kube-controller-manager、etcd 等。

          kubectl get pods -n kube-system 
          

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          6、使用 Kubernetes Dashboard 进行综合监控

          部署 Kubernetes Dashboard,在 Kubernetes Dashboard 中查看各种资源的信息,包括节点、Pod、服务、持久卷等。可以在 Dashboard 中浏览各种指标和图表,了解集群的运行情况,并对资源进行管理和调整。

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

          💖The End💖点点关注,收藏不迷路💖
VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]