데이터센터(IDC)가 무엇일까? 데이터센터 개념과 하는 일 자세하게 들여다보자

    안녕하세요. 이번 포스팅에서는 IDC(Internet Data Center)라고도 부르는 데이터센터에 대해서 알아보는 시간을 가지도록 하겠습니다. 

    ▶ 데이터 센터란 무엇일까?

    데이터 센터는 기업에서 서버와 스토리지(저장소)를 설치하고 운영하는 장소입니다. 무수히 많은 서버가 모여 있는 곳이기 때문에 Server Hotel 혹은 Server Farm이라고 부르기도 하는 데이터 센터는 중요한 역할을 하는 하드웨어가 효과적이고 안정적으로 운영되기 위해서 정교하게 관리되는 백업, 보안, 공조, 전원 관리 시스템과 화재나 폭우, 태풍 같은 재해에도 견딜 수 있는 시설을 갖추고 있습니다.

     

    무수히 많은 서버가 모여 있는 데이터 센터

    ▶ 데이터 센터의 역사

    데이터 센터가 본격적으로 등장하기 시작한 때는 1990년말 ~ 2000년 초반으로 흔히 닷컴버블이라는 표현으로 불리웠던 시대입니다. IT업을 기반으로 하는 소규모의 벤처 기업이 많이 생겨나면서 독자적으로 서버를 운영하기에 비용적으로 부담스러웠던 기업들로부터 데이터 센터에 대한 수요가 발생하자 오늘날과 같은 IDC 사업이 진행되었습니다. 마치 공장에서 시간당 생산량이 중요한 척도로 사용되는 것처럼 데이터 센터에서는 얼마나 많은 서버를 안정적으로 운영할 수 있는지가 중요한 척도로 사용됩니다. 그래서 점점 더 큰 대규모 환경에서 안정적이고 효과적으로 서버를 운영할 수 있는 방법으로 발전 되었고 최근에는 기업의 수요에 탄력적으로 대응할 수 있도록 수 분내로 신규 기기를 투입할 수 있는 클라우드의 형태로 DcaaS(Data Center as a Service) 기술이 떠오르고 있습니다.

    ▶ 데이터 센터 등급(DC Level)

    TIA(Telecommunications Industry Association)이라는 단체는 데이터 센터의 표준을 정의하는 곳입니다. 이 단체에서 정의한 각 데이터 센터의 등급은 다음과 같습니다.

     

    • Tier 1 Basic —리던던트(Redundant) 구성요소가 없음(N) : 99.671% 가용성
      • 계획/비계획적인 활동에 따른 장애 가능성 있음
      • 전력 공급과 냉각이 단일 경로화되어 있음
      • 예방 유지 보수를 수행하기 위해 셧다운해야 함
      • 연간 28.8시간의 다운타임
    • Tier 2 — 리던던트 구성요소(제한적인 N+1) : 99.741% 가용성
      • 계획/비계획적인 활동에 따른 장애 가능성이 Tier1에 비하여 낮음
      • 전력과 냉각 설비는 N+1 리던던트 구성으로 되어 있으나 공급 경로는 단일 경로로 되어 있음
      • Raised Floor, UPS 및 발전기 포함
      • 연간 22.0시간의 다운타임
    • Tier 3 — Concurrent 유지 보수 환경(N+1) : 99.982% 가용성
      • 전산 시스템에 대한 영향 없이 정기 예방 점검과 유지 보수와 같은 계획된 활동이 가능함(비계획 활동은 장애를 유발시킬 수 있음)
      • 전력과 냉각의 공급 경로의 복수 구성(하나는 액티브 경로), 리던던트 구성(N+1)
      • 연간 1.6시간의 다운타임
    • Tier 4 — Fault Tolerant(2N+1) : 99.995% 가용성
      • 계획된 활동은 핵심 운영에 영향을 주지 않으며, 예상치 못한 최악의 사고가 발생해도 핵심 부하에 영향을 주지는 않음
      • 복수의 액티브 전력 및 냉각 경로
      • 연간 0.4시간의 다운타임

    안정성 측면에서 바라보면 당연히 Tier 3보다 Tier 4가 더 뛰어난 성능이지만 Tier 4는 Tier 3에 비해서 약 2배에 가까운 공간과 인프라가 필요하기 때문에 그에 따른 비용이 훨씬 더 비쌉니다. 그래서 실제로는 많은 기업들이 비교적 더 경제적인 Tier 3의 운영을 더 선호하고 있는 상황입니다.

    ▶ 데이터 센터 구성요소

    데이터 센터의 주요 구성 요소는 크게 4가지로 구성되어 있습니다.

     

    1. 상면: 장비나 설비를 설치할 수 있는 공간으로, 실제 IT 장비를 설치할 수 있는 곳을 White Space, 장비를 설치할 수 없는 곳을 Grey Space로 구분하고 있습니다.

     

    * 더 이상 사용할 상면 공간이 없으면 어떻게 대응할 수 있을까요? 상면 공간 확보에 관한 문제는 데이터 센터에서 지속적으로 발생하는 고민입니다. 우선, 데이터 센터에서는 항상 최적화를 위해서 업무를 진행하고 있고 서버를 가상화해서 전체 서버의 전력 부하와 공간을 줄이거나 설비 효율을 증대시키는 것을 통해서 수용 가능한 용량을 확보할 수 있습니다. 만일 더 이상 최적화를 통해서 가용 용량을 확보하기 어렵다면, 새로운 데이터 센터로 이전해야 할 필요가 발생합니다. 데이터 센터를 이전하는 것 이외에는 colocation이나 클라우드 컴퓨팅을 통해서 필요한 리소스를 확보할 수도 있습니다.

     

    * Colocation은 한 기업의 데이터 센터 설비를 다른 기업에 제공하는 비즈니스 모델입니다. 마치 쉐어하우스처럼 하나의 데이터 센터에 여러 기업의 데이터 센터가 입주해있고 각 기업이 시스템을 각자 소유하고 데이터 센터 운영을 위한 전력, 냉각 인프라 같은 설비 관리를 공유합니다.

     

    2. Support Infrastructure: 데이터 센터 운영 지원을 위해서 White Space 이외에 추가적으로 필요한 전기실, 발전기실, UPS(Uninterruptible Power Supply), 공조기 등을 포함하는 공간과 설비를 가리킵니다.

     

    3. IT Equipment: 컴퓨팅 서비스를 제공하기 위해서 필요한 Rack(랙)과 서버, 스토리지, 네트워크 장비, 관리 시스템, 케이블링 등을 포함하는 용어입니다.

     

    4. Operations: 운영 인력은 시스템을 정상적으로 운영 및 관리하기 위해서 필요한 경우 업그레이드와 수리를 담당합니다. 일반적으로 회사에서 IT 기술 운영 팀과 설비 지원 시스템 팀을 따로 두고 관리하도록 하고 있습니다. 특히 설비 지원 시스템을 담당하고 있는 System Engineer는 데이터 센터가 항시 정상 가동될 수 있도록 24/7 관리하고 있습니다.

     

    데이터 센터 운영의 핵심은 안정성과 효율일 것입니다.

    데이터 센터 관련 지표 / 인증

    데이터 센터에 대해서 얘기할 때 그 효율이나 수준을 표현하기 위해서 사용되는 지표와 인증이 있는데 몇 가지 살펴보도록 하겠습니다.

    1. PUE(Power Usage Effectiveness)

    데이터 센터의 에너지 효율성을 표시하는 데 사용하는 단위입니다. PUE는 데이터 센터에 인입되는 전력량을 그 안에 있는 데이터 센터의 인프라가 동작하면서 사용하는 전력량으로 나눈 값이다. 예를 들어 100W의 IT 장비를 동작시키는데 275W를 공급해야 한다면, PUE = 275/100 = 2.75가 됩니다. PUE는 IT 소비 전력 대비 전체 전력량의 비율로 표시되며, 1에 가까울수록 효율성이 좋은 것을 의미합니다. 일반적으로 1.3(우수)에서 3.0(나쁨)에 걸쳐 있고 평균은 2.5 정도입니다. 

    2. DCiE(Data Center Infrastructure Efficiency)

    DCiE는 PUE와 함께 데이터 센터의 효율을 표시하는 또 다른 단위로, IT 장비에 공급되는 전력량을 전체 설비에 대한 공급 전력량 기준으로 백분율로 표현한 것입니다. 다시 말해 데이터 센터 전체 전력 중 IT 장비가 사용하는 전력량이 몇 퍼센트인지 나타내며 100%에 근접할수록 효율이 좋은 것을 의미합니다. 일반적인 DCiE 값은 33%(나쁨)에서부터 77%(우수)에 걸쳐 있고 평균 DCiE는 40%입니다.

    3. LEED Certified

    LEED(Leadership in Energy and Environmental Design)는 건물이나 설비에서 물 같은 자원이나 기타 에너지를 효율적으로 사용하고 있는지에 대해 판단하고, 이산화탄소 배출 감소와 실내 환경 품질(공조, 조명 등), 친환경 자재 채용 의무와 같은 항목을 다루고 있습니다. LEED 인증은 등급제인데, '표준'(계량 전 점수대비 40%~50%), 'Silver'(50%~60%), 'Gold'(60%~80%), 'Platinum'(80% 이상)의 4단계가 있고, 가장 높은 등급인 Platinum 인증을 받을 경우 인증 비용을 환불받을 수 있습니다.

     

    지금까지 데이터 센터가 어떤 것인지, 그리고 데이터 센터와 관련되어 어떤 용어와 지표들이 사용되고 있는지 살펴보았습니다. 앞으로 점점 더 데이터 센터에 대한 얘기를 많이 듣게 될 것으로 예상되는데 데이터 센터에 대한 이해에 도움이 되었으면 좋겠습니다. 감사합니다.

    댓글

    Designed by JB FACTORY