Tachyum은 NVIDIA H100 GPU보다 6배 더 빨라야 하는 범용 프로세서의 아키텍처에 대해 이야기합니다.

Tachyum은 NVIDIA H100 GPU보다 6배 더 빨라야 하는 범용 프로세서의 아키텍처에 대해 이야기합니다.

Tachyum 은 향후 AI, HPC 및 클라우드 데이터 센터 시장의 주요 업체가 되는 것을 목표로 합니다. 그들의 유일한 제품인 Prodigy 는 올인원 프로세서입니다. 이 칩은 비용 효율성과 성능을 위해 GPU, CPU 및 TPU의 성능을 하나의 장치에 결합합니다. Tachyum이라는 이름은 2018년 Prodigy 프로세서 를 출시했을 때 나타났습니다. 현재 아키텍처를 요약한 전체 백서가 웹사이트에서 제공됩니다.

원더카인드를 만나다

Tachyum은 Prodigy 프로세서의 칩 레이아웃과 아키텍처를 공개했습니다. 128 개의 CPU 코어, 16개의 DDR5-7200 메모리 컨트롤러 및 64개의 PCIe 5.0 레인 이 최고의 처리 능력을 제공합니다. 주요 장치는 초당 10테라비트 그리드 를 통해 연결됩니다 . 프로세서는 AMDIntel 의 최신 제품과 일치하는 5.7GHz 의 최대 성능으로 실행됩니다 .

신동 CPU 검토 | 타훔

Prodigy는 TSMC 의 업계 최고의 5nm 공정 으로 제조됩니다. 이를 통해 500mm² 보다 작은 수정을 사용할 수 있습니다 . 패키지 자체는 모놀리식 디자인을 기반으로 합니다. ISA(명령어 집합 아키텍처)는 RISCCISC 를 결합한 특수 버전입니다 . 이 ISA는 모든 비효율적인 명령어를 효과적으로 제거하며 모든 명령어의 너비는 32/64 비트를 넘지 않습니다 .

기능 블록을 보여주는 프로디지 모형 | 타훔

Prodigy CPU에는 클럭당 최대 8개의 명령어를 디코딩하고 삭제할 수 있는 맞춤형 아키텍처가 있습니다. 유사하게, 이 CPU 는 최대 48개 명령어를 지원하는 명령어 대기열과 15 개 항목 깊이 의 12개 대기열 을 지원하는 스케줄러로 클록당 11개 명령어를 실행할 수 있습니다.

CPU는 4개의 ALU , 1개의 로드 유닛, 1개의 저장 유닛, 1개의 로드/저장 유닛, 1개의 마스크 유닛 및 2개의 1024 비트 벡터 유닛과 함께 제공됩니다. 코어에는 4096 비트 매트릭스 블록 으로 구동되는 인공 지능 하위 시스템이 있습니다.

신동의 아키텍처 다이어그램 | 타훔

성능 면에서 이 올인원 솔루션은 AI FP8 성능 에서 최첨단 NVIDIA H100 프로세서의 6 배 성능을 제공할 수 있습니다 . 마찬가지로 Tachyum은 더 많은 샷을 만들어 그린 팀에 비해 효율성 이 무려 9배나 향상되었습니다. 이 숫자가 일대일 비교에 얼마나 잘 부합하는지 보는 것은 흥미로울 것입니다.

출시일

이 수치와 수치에 대한 모든 크레딧은 tachyum 에 있습니다. 프로디지 프로세서는 내년 출시, 양산은 2023년 하반기로 예정돼 있다 .

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다