Nvidia의 차세대 플래그십 Ada Lovelace GPU, FP32 처리 능력 100TFLOP 달성

Nvidia의 차세대 플래그십 Ada Lovelace GPU, FP32 처리 능력 100TFLOP 달성
주요 경쟁사인 NVIDIA와 AMD가 올해 말 이전에 차세대 그래픽 카드 출시를 준비하면서 GPU 시장이 뜨거워지고 있습니다. Arc A-Series를 통해 주로 프로세서 업체인 Intel도 처음으로 외장 그래픽 시장에 진출합니다. 이번에 세 회사가 인민의 호주머니를 놓고 경쟁을 벌이게 되며, 경쟁은 역대 최고로, 유출은 불가피하다.

공식 뉴스가 없던 시기에 여러 출처에서 유출과 루머가 돌았다. NVIDIA와 AMD의 최고 플래그십 SKU에 대한 새로운 발표가 매일 발표되며, 두 경쟁자의 처리 능력에 관한 두 가지 새로운 발표가 있기 때문에 오늘도 예외는 아닙니다. 흥미롭게도 Team Green과 Red의 현재 수치는 놀라울 정도로 비슷하여 시장이 얼마나 뜨거울지 보여주는 또 다른 지표입니다.

AMD의 플래그십 GPU와 예상 성능에 대한 기사를 이미 썼지만 이 기사는 NVIDIA의 차기 BFGPU에 관한 것입니다. 곧 출시될 RTX 4000 시리즈(또는 이름이 무엇이든 간에)의 중심에 있는 NVIDIA의 차세대 GPU 아키텍처인 Ada Lovelace는 현재 세대 RTX 3000 시리즈에 대한 주요 업그레이드를 제공한다고 합니다. 이 전략은 AMD와 거의 동일하며, RDNA 3을 사용하여 RDNA 2에 비해 상당한 개선을 가져온다고 합니다.

NVIDIA Ada Lovelace GPU | 엔비디아

Ada Lovelace는 100테라플롭스를 기록했습니다. 

NVIDIA의 차세대 GPU는 AD102이며 RTX 4090(및 4090Ti)과 TITAN 클래스 카드에 전원을 공급하는 데 사용될 것입니다. 인기 있는 내부자 kopite7kimiGreymon55 의 두 가지 새로운 소문에 따르면 AD102는 100 TFLOP 장벽을 깨고 인기 있는 소비자 그래픽 카드 중 가장 높은 FP32 컴퓨팅 성능을 제공합니다. 

이에 비해 현재 세대 RTX 3090 Ti는 현재 GPU 중 가장 높은 40~45테라플롭의 FP32 처리 능력을 제공합니다. 따라서 우리는 AD102를 사용하는 현재 BFGPU에 비해 ​​최소 2배 개선된 성능을 보고 있습니다. 작년에 RTX 3090(비 Ti)이 여전히 NVIDIA에서 제작한 최고 성능의 소비자급 게임용 GPU였을 때 Greymon 자체의 누출은 AD102가 RTX 3090의 두 배 이상의 성능을 가질 것이라고 주장했습니다. 대체로 사실이었다. 그리고 오늘날까지.

두 지도자 모두 AD102 FP32의 정확한 기능 수에 반대하지만 일반적으로 100 TFLOP에 도달하거나 초과할 가능성이 있다는 데 동의합니다. 반면 AMD의 차세대 플래그십 Navi 31 GPU는 92 TFLOP FP32 처리 능력을 가지고 있다는 소문이 있습니다. 이는 23테라플롭의 RX 6900XT보다 4배 더 많습니다. 이 전례 없는 성능 향상은 또한 전력 소비의 상당한 증가를 설명합니다.

오늘날 350-400W GPU가 표준이 되었으며 RTX 3090 Ti는 일부 극단적인 GPU 옵션에서 500W를 쉽게 돌파했습니다. 이것은 이미 이전 세대의 275W 표준에서 상당한 변화입니다. 그러나 다음 세대에서는 그래픽 카드의 TGP가 최대 900W일 것으로 예상합니다. 이것이 미친 짓이라는 것을 알기 위해 하드웨어 엔지니어가 될 필요는 없습니다. GPU는 이미 전력 소모가 많았지만 차세대는 그 선례를 완전히 다른 수준으로 끌어올리려고 합니다.

TFLOP이 결국 중요한 것은 아니라는 점에 유의하는 것이 중요합니다. 더 많은 테라플롭이 더 나은 게임 성능으로 직접 변환되지는 않습니다. 여기에는 다른 많은 요소가 작용하고 있으며, 리더들조차 레이 트레이싱 기능, 독점 확장 기술 등과 같은 것들이 차세대 GPU의 성공에 기여할 것이라고 제안합니다.

추가 분석

사양 측면에서 AD102의 100 TFLOP 점수는 2.7GHz에서 클럭되는 18,432개의 CUDA 코어를 수용하여 달성됩니다. 그러나 이것은 RTX 4090 Ti(및 아마도 새로운 RTX TITAN)가 사용할 전체 크기 다이에 있는 최대 CUDA 코어 수입니다. RTX 4090에는 TFLOP에 영향을 줄 AD102의 축소 버전이 있을 가능성이 큽니다. 그러나 내가 말했듯이 TFLOP은 그다지 중요하지 않으며 코어 수가 적을수록 클럭 속도가 빨라지므로 실제로 게임 성능에 상당한 영향을 미칩니다.

예를 들어 Greymon55 AMD의 차세대 RDNA 3 플래그십 GPU가 최대 3GHz에서 실행될 것이라고 밝혔습니다. AD102의 2.7GHz 주파수는 이미 이에 매우 가깝지만 RTX 4090은 실제로 AMD의 부스트 클럭 속도와 일치할 수 있습니다. 따라서 ~3GHz가 차세대 플래그십 그래픽 카드의 표준 클럭 속도가 될 것으로 예상합니다. 그리고 RDNA 3 및 Ada Lovelace GPU를 제조하는 데 사용될 TSMC의 4nm 공정 노드에 부분적으로 책임이 있습니다.

다시 말하지만, 이것은 모두 이론적인 성능이므로 게임 성능을 판단하기 위해 GPU의 TFLOP 처리 능력을 알 필요조차 없습니다. 테라플롭은 총 코어 수에 GPU 클럭 속도를 곱한 다음 그 결과에 2를 곱하여 TFLOP 수를 구함으로써 계산됩니다. 이것은 다른 특성을 고려하지 않기 때문에 GPU가 초당 수행할 수 있는(부동 소수점) 연산 수에 대한 매우 피상적인 추정 수준이며 테라플롭이 유연성만을 위해 가장 잘 유지된다는 것을 증명합니다.

그래도 제품 출시 몇 달 전에 모든 것을 분석하기 위해 숫자를 보는 것은 재미있습니다. 제 말은, 그것이 결국 게임 하드웨어 저널리즘의 본질입니다. 그러나 공식 뉴스가 나오기까지 그렇게 오래 기다릴 필요는 없습니다. AMD와 NVIDIA는 모두 금년 3분기에 같은 시기에 차세대 GPU를 출시할 것으로 예상되며 오늘부터 사전 발표가 시작됩니다. 컴퓨텍스 2022 5월.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다