열광자들은 AMD의 새로운 Instinct GPU에 대해 엇갈린 감정을 가지고 있습니다.

2022/07/27

AMD Instinct는 AMD의 전문 GPU 브랜드입니다. AI, 머신 러닝과 같은 과중한 워크로드에 자주 사용되며 데이터 센터용 NVIDIA GPU와 같은 역할을 합니다.

AMD는 2021년에 Instinct MI250 GPU를 출시했습니다. 상대적으로 비싸고 많이 사용되지 않는 GPU이기 때문에 벤치마크가 많지 않았습니다. 최근 Twitter의 ProjectPhysX 는 이 GPU에서 몇 가지 벤치마크를 실행한 후 의견을 공유했으며 그녀의 생각은 매우 흥미로웠습니다.

일련의 트윗 (스레드)에서 그녀는 몇 가지 물음표와 함께 기대할 수 있는 성능에 대한 자신의 의견을 밝혔습니다.

MI250에 대한 AMD의 잘못된 설명이 있습니다. 이 GPU는 “Single Chiplet GPU”로 청구되지만 2개의 GPU가 있는 2개의 GCD(Graphics Complex Arrays)가 있습니다. 즉, MCM(Multi Chip Module) 칩입니다. 128GB의 GPU 메모리는 두 GCD 간에 공유됩니다.

글쎄, 그게 뭐가 문제야? 문제는 한 GPU가 다른 GPU의 데이터에 직접 액세스할 수 없다는 것입니다. 이것을 SLI에 대한 AMD의 시도로 생각하십시오. 그러나 기계 학습에서입니다. 많은 알고리즘과 소프트웨어는 여러 GPU에서 작동하도록 구성되어 있지 않습니다. 즉, 128GB의 메모리가 64GB로 위장되는 경우가 많습니다. 일부 알고리즘은 소프트웨어 병목 현상으로 인해 더 느리게 실행될 수 있습니다.

ProjectPhysX 는 계속해서 MI200이 문서상 보기에는 괜찮아 보이고 때로는 NVIDIA의 A100보다 더 빠릅니다. 그러나 Boltzmann 격자와 같은 대역폭이 제한된 애플리케이션 및 벤치마크에서 이 GPU는 NVIDIA A100과 동등한 성능을 제공할 수 없습니다. 그 이유는 10년 정도 된 NVIDIA Kepler 아키텍처만큼 비효율적이기 때문입니다.

차트가 커 보일 수 있지만 Instinct MI200보다 훨씬 우수한 성능을 제공하는 NVIDIA A100에 중점을 두어야 합니다.

AMD Instinct GPU와 다른 아키텍처의 비교 | ProjectPhysX

모든 희망이 사라진 것은 아닙니다. 이는 스토리지가 두 배(32GB 대 MI200의 경우 64GB)인 지난 세대(MI100)에 비해 여전히 크게 개선되었기 때문입니다. 또한 노드는 빠른 상호 연결이 가능한 4개의 소켓에 8개의 GPU가 있어 훨씬 더 좋습니다.

AMD는 비용 효율적인 고속 컴퓨팅 솔루션으로 데이터 센터를 목표로 삼고 있지만 NVIDIA는 AI 워크로드를 위한 다가오는 Hopper 아키텍처로 여전히 실질적인 위협이 되고 있습니다.

여기에서 MI250에 대해 자세히 알아 보세요.

답글 남기기 응답 취소