[12/36] 5-2. 쿠버네티스 Pod - livenessProbe를 이용해서 Self-healing Pod 만들기

https://www.youtube.com/watch?v=0rYt3PcggzA&list=PLApuRlvrZKohaBHvXAOhUD-RxD0uQ3z0c&index=10

Category : 따배쿠
Tag : 따배쿠

수업내용

Part 1. 쿠버네티스 시작하기

쿠버네티스 소개
쿠버네티스 설치하기
쿠버네티스로 컨테이너 실행하기
Part 2. 쿠버네티스 기본 개념
쿠버네티스 아키텍처
파드
컨트롤러
서비스
인그레스
레이블과 애너테이션
컨피그맵
시크릿
Part 3. 쿠버네티스 한 걸음 더 들어가기
파드 스케쥴링
인증과 권한관리
데이터 저장
클러스터 네트워킹 구성
쿠버네티스 DNS
로깅과 모니터링
오토스케일링
사용자 정의 자원
쿠버네티스 기반으로 워드프레스 앱 실행하기
헬름

5-2. 쿠버네티스 Pod - livenessProbe를 이용해서 Self-healing Pod 만들기

kubelet으로 컨테이너 진단하기

Self-healing

Restarts containers that fail, replaces and reschedules containers when nodes die, kills containers that don’t respond to your user-defined health check, and doesn’t advertise them to clients until they are ready to serve.

장애가 발생한 컨테이너를 다시 시작하고, 노드가 중단될 때 컨테이너를 교체 및 일정 변경하고, 사용자 정의 상태 검사에 응답하지 않는 컨테이너를 종료하고, 서비스를 제공할 준비가 될 때까지 클라이언트에 알림을 표시하지 않습니다.

LivenessProbe(1)

Pod가 계속 실행할 수 있음을 보장
Pod의 spec에 정의

Pod-definition(Self healing기능 X)

apiVersion: v1
kind: Pod
metadata:
name: nginx-pod
spec:
containers:
- name: nginx-container
    image: nginx:1.14

livenessProbe definition(Self healing기능 O)

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod
spec:
  containers:
  - name: nginx-container
    image: nginx:1.14
    livenessProbe:
      httpGet:
        path: /
        port: 80

running중인 상태에 livenessProbe를 http 프로토콜 80번포트를 통해 주기적으로 신호를 보내 응답이 정상적으로오는지 자가진단

LivenessProbe(2)

livenessProbe 매커니즘

httpGet probe

지정한 ip주소, port, path에 HTTP GET 요청을 보내, 해당 컨테이너가 응답하는지를 확인한다. 반환코드가 200이 아닌 값이 나오면 오류, 컨테이너를 다시 시작한다. 연속해서 3번 실패한 컨테이너는 죽인 후 다시 컨테이너를 도커 허브로부터 받아 재 실행

livenessProbe:
  httpGet
    path: /
    port: 80

tcpSocket probe

지정된 포트에 TCP연결을 시도. 연결되지 않으면 컨테이너를 다시 시작한다.

livenessProbe:
  tcpSocker:
    port:22

exec porbe

exec 명령을 전달하고 명령의 종료코드가 0이 아니면 컨테이너를 다시 시작한다.

livenessProbe:
  exec:
    command:
    - ls
    - /data/file

LivenessProbe(3)

liveness Probe 매개변수
- periodSeconds: health check 반복 실행 시간(초)
- initialDelaySeconds: Pod 실행 후 delay할 시간(초)
- timeoutSeconds: health check후 응답을 기다리는 시간(초)

Pod-definition

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod
spec:
  containers:
  - name: nginx-container
    image: nginx:1.14

livenessProbe definition

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod
spec:
  containers:
  - name: nginx-container
    image: nginx:1.14
    livenessProbe:
      httpGet:
        path: /
        port: 80

      initialDelaySeconds: 15
      periodSeconds: 20   # 20초마다 검사
      timeoutSeconds: 1   # 1초내에 무응답시 실패로 간주
      successThreshold: 1 # 1번 실행했을때 성공시 성공으로 간주
      failureThreshold: 3 # 3번까지 30초마다 검사시 실패로 인식

실습

pod-nginx-liveness.yaml

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod-liveness
spec:
  containers:
  - name: nginx-container
    image: nginx:1.14
    ports:
      - containerPort: 80
        protocol: TCP
    livenessProbe:
      httpGet:
        path: /
        port: 80
      successThreshold: 1
      timeoutSeconds: 3
      periodSeconds: 30
      failureThreshold: 3

LivenessProbe example

liveness Probe는 Pod의 spec에 정의한다. 아래 example에서 사용한 smlinux/unhealthy컨테이너는 HTTP connection 있을 때 마다 내부 서버오류로 HTTP 500 ERROR를 발생

smlinux/unhealthy

smlinux/unhealthy컨테이너를 실행하여 5번까지 200번코드를 반환해서 성공으로 간주한다. 예) periodSeconds:10초로 세팅되어있는 경우 10초마다 검사해서 50초 정도 성공 60,70초에 에러 발생시 컨테이너가 restart를 시킨다. 오류를 일부러 발생하는 컨테이너

pod-liveness.yaml

cat > pod-liveness.yaml
apiVersion: v1
kind: Pod
metadata:
  name: liveness-pod
spec:
  containers:
  - image: smlinux/unhealthy
    name: unhealthy-container
    ports:
    - containerPort: 8080
      protocol: TCP
    livenessProbe:
      httpGet:
        path: /
        port: 8080

yaml 파일 실행

kubectl create -f pod-liveness.yaml

실습

master@MASTER:~$ kubectl describe pod liveness-pod

Liveness:       http-get http://:8080/ delay=0s timeout=1s period=10s #success=1 #failure=

...

Type     Reason     Age                   From               Message
  ----     ------     ----                  ----               -------
  Normal   Scheduled  40m                   default-scheduler  Successfully assigned default/liveness-pod to node02
  Normal   Pulled     40m                   kubelet            Successfully pulled image "smlinux/unhealthy" in 24.728s (24.728s including waiting)      
  Normal   Pulled     38m                   kubelet            Successfully pulled image "smlinux/unhealthy" in 1.482s (1.482s including waiting)        
  Normal   Created    36m (x3 over 40m)     kubelet            Created container unhealthy-container
  Normal   Started    36m (x3 over 40m)     kubelet            Started container unhealthy-container
  Normal   Pulled     36m                   kubelet            Successfully pulled image "smlinux/unhealthy" in 1.449s (1.449s including waiting)        
  Normal   Killing    35m (x3 over 38m)     kubelet            Container unhealthy-container failed liveness probe, will be restarted
  Normal   Pulled     34m                   kubelet            Successfully pulled image "smlinux/unhealthy" in 1.457s (1.457s including waiting)        
  Warning  Unhealthy  15m (x28 over 39m)    kubelet            Liveness probe failed: HTTP probe failed with statuscode: 500
  Warning  BackOff    5m37s (x68 over 27m)  kubelet            Back-off restarting failed container unhealthy-container in pod liveness-pod_default(d7ea26d9-7af7-42cd-acd1-0e374a8e99c2)
  Normal   Pulling    34s (x13 over 40m)    kubelet            Pulling image "smlinux/unhealthy"

명령어 실행 예시

master@MASTER:~$ kubectl create -f pod-liveness.yaml
pod/liveness-pod created

EXAMPLE

아래의 liveness-exam.yaml 파일에 self-healing 기능을 추가하시오

동작되는 Pod내의 컨테이너에 /tmp/healthy 파일이 있는지 5초마다 확인한다.
Pod 실행 후 10초 후 부터 검사한다.
성공횟수는 1번, 실패횟수는 연속 2회로 구성한다.

샘플파일 : liveness-exam.yaml

apiVersion: v1
kind: Pod
metadata:
  name: liveness-exam
spec:
  containers:
  - name: busybox-container
    image: busybox
    args:
    - /bin/sh
    - -c
    - touch /tmp/healthy; sleep 30; rm -rf /tmp/healthy; sleep 600

정답 [문제풀이]

apiVersion: v1
kind: Pod
metadata:
  name: liveness-exam
spec:
  containers:
  - name: busybox-container
    image: busybox
    args:
    - /bin/sh
    - -c
    - touch /tmp/healthy; sleep 30; rm -rf /tmp/healthy; sleep 600
    livenessProbe:
      exec:
        command:
        - ls
        - /tmp/healthy
      initialDelaySeconds: 10
      failureThreshold: 2
      periodSeconds: 5
      successThreshold: 1
      timeoutSeconds: 1

By 김민서

The BlackCode got Dream