홈Tech blogNVIDIA GUP 사용 효율성을 높이는 Zadara 멀티 테넌트 AI 인프라 구현방법

Tech blog

기다림 없이, 가능성을 여는 클라우드

2026년 01월 08일

NVIDIA GUP 사용 효율성을 높이는 Zadara 멀티 테넌트 AI 인프라 구현방법

핵심 요약 (Executive Summary)

NVIDIA는 확장 가능하고 소프트웨어 정의 방식의 새로운 형태의 AI Factory를 지원하는 레퍼런스 아키텍처를 통해 AI 인프라의 진화를 주도하고 있습니다. 이러한 환경은 멀티 테넌시, 소버린, 프라이빗 클라우드 전반에서 성능, 보안, 민첩성을 요구합니다.
Zadara는 엔터프라이즈급 오케스트레이션, GPU 성능 인식 스케줄링, 그리고 NVIDIA의 네트워킹 및 DPU 기술과의 네이티브 통합이 결합된 클라우드 네이티브 IaaS(Infrastructure-as-a-Service) 시스템을 통해 이러한 요구를 충족합니다. 이를 통해 서비스 제공자, 통신사, 기업은 NVIDIA 기반 인프라를 멀티 테넌트 환경에 빠르고 안전하게, 그리고 비용 및 규제 준수 측면에서 완전한 통제 하에 배포할 수 있습니다.
이 백서에서는 Zadara가 기반 인프라부터 컨테이너화된 AI 스택 실행에 이르기까지 NVIDIA AI Factory 아키텍처를 구현하는 데 있어 중심적인 역할을 수행하는 방식을 설명합니다. 또한 Zadara가 보안 GPU 네트워킹, NVIDIA 가상화 가이드라인에 따른 VM 단위 GPU 할당(1, 2, 4 또는 8 GPU per VM), 그리고 NVIDIA Cloud Partner 레퍼런스 아키텍처를 활용한 DPU 가속 네트워크 오프로드를 어떻게 지원하는지도 설명합니다.
아울러 이 백서는 Zadara가 실제 환경에서의 배포를 통해 운영 복잡성을 단순화하고 성능을 정밀하게 제어할 수 있도록 지원하는 방식을 강조합니다. Zadara의 인프라는 조직이 소버린하고 멀티 테넌트 기반의 AI 클라우드를 신뢰를 바탕으로 구축하고 확장할 수 있도록 설계되어 있습니다.

Zadara의 주요 이점 요약

Zadara는 GPU 인프라와 비GPU 인프라를 함께 운영할 수 있는 통합형 관리 클라우드 시스템을 제공합니다. 고객은 AI, 컴퓨팅, 스토리지, 네트워크 워크로드를 단일 운영 모델 내에서 통합할 수 있습니다. 이를 통해 하이브리드 환경 배포, 워크로드의 원활한 마이그레이션, 환경 간 일관된 사용자 경험을 실현할 수 있습니다. 각 테넌트 환경은 보안이 보장되고 GPU 및 네트워킹이 완전히 연결된 상태로 인스턴스화되며, 이를 통해 데이터 과학자, 머신러닝 엔지니어, 또는 추론 환경을 구축하는 DevOps 담당자는 클라우드 제공자의 수동 개입 없이 즉시 작업을 시작할 수 있습니다.

NVIDIA BlueField DPU 및 Spectrum-X 네트워킹을 네이티브로 지원
NCP(NVIDIA Cloud Partners) 레퍼런스 아키텍처와 완전히 정렬
글로벌 소버린 AI 클라우드 확장성과 완전한 규제 준수 기반
Zadara GPU-Net을 통한 투명한 GPU 간 네트워킹(GPU-to-GPU networking)
VM 기반 GPU 노드 할당 (VM당 1, 2, 4 또는 8개의 GPU) 및 GPU, SuperNIC 패스스루 지원
SR-IOV 인터페이스 기반 DPU 오프로드 네트워크 스택 및 DOCA 가속 서비스 제공(firewall, telemetry, microsegmentation)

도표 1: Zadara 클라우드 구조 — 분산된 자가 관리형 엣지 위치와 선택 가능한 중앙 집중식 제어

Zadara는 이 모든 기능을 완전 관리형 서비스로 제공하며, 24/7 모니터링, 인프라 수명 주기 관리, 2차 운영 지원을 포함합니다. 이를 통해 클라우드 제공자, 통신사, 엔터프라이즈 IT 팀은 Zadara를 기반으로 성능, 가용성, 지속적인 규정 준수를 보장받으며 AI 서비스를 자신 있게 제공할 수 있습니다.

소버린 AI 엣지 클라우드 구현

AI 워크로드가 확장됨에 따라, 인프라 제공자는 멀티 테넌시, 동적 프로비저닝, 하드웨어 수준의 격리를 지원하는 보안성과 고성능을 갖춘 환경을 제공해야 합니다. 이러한 기능은 더 이상 하이퍼스케일러만의 전유물이 아니며, 지역 클라우드(regional cloud), 매니지드 서비스, 통신사, 프라이빗 엔터프라이즈 시스템에서도 필수적인 요소가 되었습니다.

Zadara는 이러한 수요를 충족시키기 위해 처음부터 설계되었습니다. Zadara의 클라우드 네이티브 IaaS(Infrastructure-as-a-Service) 시스템은 GPU 및 비GPU 워크로드를 모두 지원하며, NVIDIA의 레퍼런스 아키텍처와 통합되고, 테넌트별로 정밀하게 제어되는 오케스트레이션, 정책, 네트워크 세분화를 제공합니다. GPU 할당부터 DPU를 활용한 네트워크 오프로드에 이르기까지, Zadara는 복잡성을 추상화하면서도 성능과 규정 준수를 그대로 유지합니다.

NVIDIA Cloud Partner 레퍼런스 아키텍처는 확장 가능하고 소버린하며 멀티 테넌트를 지원하는 GPU 인프라를 구축하기 위해 필요한 원칙들을 정의합니다. 여기에 포함되는 요소는 전체 스택 오케스트레이션, GPU 할당 정책, PCI 패스스루, 테넌트 격리 네트워킹, 그리고 관측 가능성(observability)입니다. 이러한 원칙의 목표는 엣지에서 멀티 리전 팩토리(multi-region factories)에 이르기까지 다양한 환경에서 학습, 추론, 에이전트 워크로드를 지원할 수 있는 AI 클라우드(AI-ready clouds)의 배포를 단순화하는 데 있습니다.

Zadara는 이 원칙들과 완벽하게 정렬되어 있습니다. Zadara IaaS 시스템은 이러한 아키텍처를 단순한 프레임워크가 아닌 제품으로 구현하기 위한 필수 요소인 오케스트레이션 계층, GPU 및 SuperNIC 패스스루, DPU 오프로드, 테넌트별 정책 적용 기능을 제공합니다. 개별 하드웨어와 소프트웨어 구성요소를 조합하는 대신, Zadara는 NVIDIA 소프트웨어 스택을 안전하고 효율적으로 실행하는 데 필요한 모든 기능을 포함한 풀스택 관리형 클라우드 인프라를 제공합니다.

Zadara는 GPU-Net 패브릭 오케스트레이션(GPU-Net fabric orchestration), 동적 프로비저닝, 통합된 DPU 기반 정책 적용 기능을 통해 일관된 멀티 테넌트 GPU 클라우드 배포를 가능하게 합니다. Zadara의 구현에 대한 아키텍처 및 운영 세부 사항은 다음 섹션에서 자세히 다룹니다.

AI 패러다임을 재정의하는 RAG: 기업 AI의 핵심으로 부상

VMware 대안 6가지 검증된 솔루션

목록으로