SPOF란 무엇일까?(Single Point of Failure)
- 생활 IT 및 기본 개념
- 2021. 5. 24.
SPOF란, 단일 고장점(Single Point of Failure)이라고도 부르며 어떤 시스템에서 하나의 구성 요소가 동작하지 않으면 시스템 전체가 중단되는 요소를 가리키는 말입니다. 장애가 발생한 구성 요소에 대한 여분 혹은 대체 가능한 요소가 구비되어 있지 않아서 장애 복구가 완료될 때까지 운영이 불가능한 상황에 처하게 되는 것이죠.
데이터엔지니어는 하둡을 자주 다루게 되는데, 하둡의 경우에는 master의 name node(name node는 각각의 data node로 데이터를 분산시키고 관리하는 기능을 담당합니다.)가 SPOF가 됩니다. SPOF가 아닌 구성요소의 경우에는 이중화를 통해서 장애가 발생한 경우에도 시스템이 동작하도록 구성할 수 있지만, SPOF는 장애가 발생하면 시스템 전체가 다운될 수 있기 때문에 name node의 장애가 발생하지 않도록 각별한 주의를 기울여야 합니다.
대신 하둡 3.0에 들어오면서 name node 2개가 기본으로 제공되어 하나의 name node에 장애가 발생하면 다른 name node로 전환하여 보다 더 안정적인 운영이 가능하게 되었습니다. 어느 시점에서든지 name node 중 하나는 active 모드에 있고, 다른 하나는 standby(대기)모드에 있는 것입니다.