NVIDIA는 확장 가능하고 소프트웨어 정의 방식의 새로운 형태의 AI Factory를 지원하는 레퍼런스 아키텍처를 통해 AI 인프라의 진화를 주도하고 있습니다. 이러한 환경은 멀티 테넌시, 소버린, 프라이빗 클라우드 전반에서 성능, 보안, 민첩성을 요구합니다.
Zadara는 엔터프라이즈급 오케스트레이션, GPU 성능 인식 스케줄링, 그리고 NVIDIA의 네트워킹 및 DPU 기술과의 네이티브 통합이 결합된 클라우드 네이티브 IaaS(Infrastructure-as-a-Service) 시스템을 통해 이러한 요구를 충족합니다. 이를 통해 서비스 제공자, 통신사, 기업은 NVIDIA 기반 인프라를 멀티 테넌트 환경에 빠르고 안전하게, 그리고 비용 및 규제 준수 측면에서 완전한 통제 하에 배포할 수 있습니다.
이 백서에서는 Zadara가 기반 인프라부터 컨테이너화된 AI 스택 실행에 이르기까지 NVIDIA AI Factory 아키텍처를 구현하는 데 있어 중심적인 역할을 수행하는 방식을 설명합니다. 또한 Zadara가 보안 GPU 네트워킹, NVIDIA 가상화 가이드라인에 따른 VM 단위 GPU 할당(1, 2, 4 또는 8 GPU per VM), 그리고 NVIDIA Cloud Partner 레퍼런스 아키텍처를 활용한 DPU 가속 네트워크 오프로드를 어떻게 지원하는지도 설명합니다.
아울러 이 백서는 Zadara가 실제 환경에서의 배포를 통해 운영 복잡성을 단순화하고 성능을 정밀하게 제어할 수 있도록 지원하는 방식을 강조합니다. Zadara의 인프라는 조직이 소버린하고 멀티 테넌트 기반의 AI 클라우드를 신뢰를 바탕으로 구축하고 확장할 수 있도록 설계되어 있습니다.
