7천개가 넘어가는 클러스터에서 쏟아지는 온콜 이슈 처리하기

홍석용/이완해

Speaker's bio

< 홍석용 >
카카오 클라우드네이티브셀 리더 입니다.

이전에는 오픈스택 기반의 클라우드 플랫폼을 개발했고, 그 경험을 바탕으로 2017년 오픈스택 코리아 커뮤니티에서 하이브리드 클라우드용 오픈스택 호라이즌 AWS 플러그인을 오픈소스로 공개했습니다.

그 이후, 컨테이너 기술의 도래와 함께 Apache Mesos 기반의 컨테이너 플랫폼을 개발했으며, 현재는 OpenStack 기반 IaaS에서 실행되는 Private Kubernetes as a Service를 개발 및 유지 관리하고 있습니다.

< 이완해 >
카카오 클라우드네이티브셀 멤버입니다.

학부 시절 매우 한정된 자원을 가진 개인 서버의 성능을 쥐어짜 내기 위해서 사용한 LXC 를 시작으로 리눅스의 컨테이너 세계에 입문하게 되었고, 현재는 카카오 클라우드네이티브 셀에서 개발자들이 이용할 수 있는 클러스터를 대량 복제 하고 있습니다.

Human Computer Interaction (HCI) 분야에 대해 관심이 많으며 Kubernetes as a Service 제품을 개발하면서 틈틈이 개발자를 위한 HCI 라는 주제에 대해서 끊임없이 생각해보고 있습니다.

Schedule

Track : 105
Time: 17:10 ~ 17:40

Session detail

카카오의 사내 Kubernetes as a Service 는 노드 개수를 기준으로 단 1년 만에 5배 정도로 급격한 성정을 이뤄내면서 현재는 7천 개가 넘어가는 클러스터에서 대략 10만여 대의 노드가 구동되고 있습니다.

다만 이러한 급성장은 더 이상 개별적인 관리가 어려울 정도의 규모가 되어버렸고 개발자들에게 운영업무에 대한 부담은 갈수록 커켰습니다. 이 세션에서는 카카오에서는 어떻게 이 문제에 대응하고 있는지에 대해 소개드립니다.