서비스 개요

고성능 연산을 위한 클러스터화 된 KT Cloud 서버 및 솔루션을 제공하는 서비스입니다. HPC(고성능 컴퓨팅) 기능을 통해 높은 대역폭, 지연 시간이 짧은 네트워킹, 고용량 컴퓨팅 파워가 필요한 애플리케이션을 사용할 때의 복잡한 과학, 공학적인 분석 및 해석 시뮬레이션 그리고 비즈니스 관련 문제를 해결할 수 있습니다. KT Cloud 인프라 자원을 필요한 대로 사용해 HPC 워크로드를 신속히 처리할 수 있고, 사용에 따라 저렴한 요금 모델을 선택해 비용을 절감할 수 있습니다.

서비스 특장점

CDN Standard 서비스 특장점
경제성
  • 필요한 용량만큼 사용하고 요금(시간 또는 월)을 지불하며 HPC 클러스터 구성 운영 가능
  • 워크로드에 따른 요금 모델 선택 가능
확장성
  • 워크로드에 필요한 규모에 따라 빠른 HPC 클러스터 확장 가능
  • 필요한 시간에 서버를 원하는 만큼 추가/제거 가능
효율성
  • GUI 기반 컴퓨팅 작업 환경 제공
  • 단 몇 분 내에 컴퓨팅 리소스를 이용할 수 있어 혁신적인 빠른 업무처리 가능
보안성
  • HPC 워크로드 관리툴 PBS Professional 솔루션 적용
  • 업계에서 유일하게 EAL 3+등급 보안인증 획득으로 보안 신뢰도 향상

구성도

구성도
  • HPC 서비스는 여러 대의 가상머신을 하나의 클러스터로 묶어 제공합니다.
  • 클러스터는 컴퓨팅 리소스를 제공하는 계산노드들과 계산노드들을 연결하여 단일 시스템처럼 보이게 하는 헤드 노드로 구성됩니다.
  • 사용자는 헤드노드에 문제를 해결하기 위한 작업(Job)을 제출하며, 헤드노드는 우선순위와 현재 계산노드의 사용량에 따라서 필요한 자원을 할당하여(schedule) 계산노드들에 작업을 분배합니다. 계산된 결과는 헤드노드를 통해서 리포팅을 받을 수 있습니다. Computing Manager는 일련의 작업 과정을 GUI를 통해서 제어할 수 있도록 도와 줍니다.

서비스 주요 기능

  • PBS Professional
    • 업계 최고의 HPC 안정성 및 활용도 증대효과 보장
    • 자원활용도 증대를 위해 최적의 스케줄링 알고리즘 제공
    • NASA, 기상청, 미국방성의 대규모 시스템 납품을 통해 검증된 확장성
    • 작업실패 최소화를 위한 계산노드 장애 검출 및 사용자 오류 자동수정(hook) 기능 제공
    • 업계 유일 EAL(국제표준 보안인증) 3+등급 인증 획득으로 보안 강화
  • 사용자 편의성 증가
    • WEB 기반 HPC 작업환경 제공
    • 실시간 실행결과 모니터링 및 파일 수정 기능 제공
    • HPC 실행환경을 Profile 관리하여 팀간 협업 가능 및 반복 작업 제거
  • 업그레이드
    • 지속적인 기능 추가 및 성능 개선 보장
    • Hook, MPI라이브러리 통합, Green Computing(전력절감 기능)
    • Job실행 속도 향상(7배), 재구동 속도 개선(40배), 동시접속 지원성능 확장(15배)
  • 기술지원
    • Altair사 전세계 14개국 27개 사무소에서 글로벌 기술지원 가능
    • 24시간 가능한 WEB 기반 Knowledge-Based 온라인 커뮤니티 사이트 운영
    • 장애 지원 및 고객응대를 위한 파트너사 및 Altair 한국지사의 프리미엄 서포팅

활용 사례

복잡한 분석 연구 수행을 위한 HPC 구성

고객 니즈

  • 복잡한 연구 과제에 대한 분석이 필요한 고객
  • 예상되는 Job 개수 2백만 건 이상, 실행 시간 2주 이상으로 고성능 컴퓨팅 구성 필요

구성 방안

  • HPC Server를 활용하여 1대의 헤드 노드와 여러 대의 계산 노드를 구성하고, 헤드 노드를 통해 job 수행 제어

구성도

구성도

연관 상품

  • Server
    • 고품질의 클라우드 서버(CPU, Memory, Disk, Network)를 제공하는 서비스로 웹 인터페이스를 통하여 쉽고 빠르게 다양한 서버를 구성할 수 있습니다.
  • GPU Server
    • KT Cloud의 기본상품들과 고객의 Legacy 시스템을 연결하여 유연하게 자원 활용률을 극대화 할 수 있으며 Hybrid Cloud 구성이 용이합니다. KT Cloud의 역량 및 자사 IDC, 네트워크 역량을 기반으로 고객 시스템에 최적화된 구성이 가능하도록 제공합니다.

솔루션 소개

  • PBS Professional®
    • HPC 워크로드를 관리하는 소프트웨어 솔루션
    • 1990년 초 NASA Ames 연구소에서 개발된 후 현재까지 안정성을 인정받아 전 세계 TOP 500에 속한 많은 대규모 HPC(High Performance Computing) 시스템에서 사용되고 있습니다.
    • PBS Professional은 HPC 시스템의 효율성 증대를 위해 CPU, 메모리, 디스크, 네트워크, SW 라이선스와 같은 HPC 자원 관리 뿐 아니라 업무환경 분석을 통해 최적의 HPC 자원 활용 계획을 제시합니다.
  • Compute Manager
    • 웹브라우저 기반 HPC 인터페이스
    • 쉽게 HPC를 활용한 작업이 가능하며 실행 중인 작업의 상태를 모니터링하고 진행된 결과를 실시간으로 차트와 애니메이션으로 확인할 수 있습니다.
    • HPC를 활용한 모든 solving작업은 Compute Manager를 통해 간단하게 수행할 수 있으며, 엔지니어들은 대규모의 시뮬레이션 연산 실행을 위해 어떻게 MPI(초병렬처리) 환경을 설정하고 실행해야 하는지 더 이상 고민할 필요가 없습니다.
  • HyperWorks
    • 오픈 아키텍처 기술 기반 CAE (Computer Aided Engineering) 기업 솔루션 패키지 제품
    • HyperWorks 안에는 전/후처리기로 세계 시장점유율 1위인 HyperMesh 와 HyperView가 있으며, OptiStruct, Radios, Acusolve, MotionSolve, FEKO 등 각 분야 전문 솔버들을 포함하여, 20여 개의 다양한 CAE 솔루션이 담겨 있습니다.

물리서버 컴퓨팅과 비교

물리서버 컴퓨팅과 비교표
구분 물리서버 기반 컴퓨팅 HPC
확장성 - 물리서버 컴퓨팅과 비교
- 용량 확대를 위해서는 H/W 추가, 교체 필요
  • - 컴퓨팅 노드 추가로 빠르게 HPC 클러스터 확장 가능
신속성 - Delivery, Installation 등 설치 시간 소요
- Hardware Maintenance 시간 소요
- 운영체제(OS) 및 HPC 스케줄러를 빠른 시간 안에 통합 설치
- Cluster를 구성하기 위한 NFS, NIS, SSH 등을 자동으로 설정
안정성 - Hardware 장애 시 서비스 불가
- 장애를 대비한 System Redundancy 필요
- cloud 여유자원으로 전환, 신속한 장애복구
- System Redundancy 불필요
비용절감 - 여유용량이 포함된 Hardware 구입비 소요
- 네트워크/상면/전력 등 운영비용 발생
- 필요 용량만큼 사용, 해당 비용 지불
- 부대 운영비용 감소

기대효과

  • 업무효율성 증대
    • WEB 기반 UI를 제공하여, 사용자가 HPC 시스템 사용에 대한 지식 없이 쉽게 사용 가능
    • HPC 작업실패 최소화에 의한 반복업무 감소
    • Application 별 실행환경 최적화에 따른 HPC 작업시간 단축
    • Profile 공유을 통한 구성원 간 원활한 협업 가능
  • HPC 자원활용 극대화
    • 작업대기(Queue) 및 예약(Reservation) 기능을 통해 주말 또는 공휴일에도 HPC 자원 사용 가능
    • 이중화, Job 보정기능, 장애 장비 자동 검출을 통해 작업 실패 최소화
    • 자원 이력 분석을 통한 투자대비 효과 제고 및 체계적인 도입 비용 산정 가능

주요 Q&A

  • QServer와 HPC의 차이점은 무엇인가요?
    • HPC는 Server와 동일한 템플릿과 기본 OS를 사용합니다.
    • 리눅스 계열 CentOS 위에 클러스터 구성, 환경 설정, Job 스케쥴러 설치 등 HPC Job 실행을 위한 환경을 자동으로 구성하여 제공합니다.
  • QJob 스케쥴러는 어떤 솔루션을 사용하고 있나요?
    • Altair사의 PBSworks, Hyperworks를 사용하고 있으며, 해당 솔루션에서 제공하는 어플리케이션을 직접 실행할 수 있습니다.
  • Q클러스터 구성은 몇 대까지 가능한가요?
    • Head 서버 1대와 Computing 서버 최대 30대까지 생성할 수 있습니다.
  • QHPC를 사용하여 어떤 Job을 실행할 수 있나요?
    • 기업/대학 연구소에서 시간이 오래 걸리는 HPC Job을 Cloud 환경에서 클러스터를 자동으로 생성하여 유전체 분석, 모바일 어플리케이션 개발 시뮬레이션, 차량 충돌 시뮬레이션 분석 등 빠른 시간 내에 원하는 결과를 얻을 수 있습니다.
    • 뿐만 아니라, 분석한 결과를 GPU 서버에서 실행하여 가시화해서 확인할 수 있습니다.