[논문 리뷰] Summarizing CPU and GPU Design Trends with Product Data
저자들은 Moore’s Law와 Dennard Scaling을 검증하기 위해 4,000개가 넘는 CPU와 GPU 제품의 데이터를 분석하며, 트랜지스터 축적이 여전히 핵심이지만 아키텍처 진보가 점점 더 중요해지고 있음을 발견했다; GPU가 여전히 CPU보다 우수하나, CPU의 SIMD 확장과 코어 수 증가로 격차가 좁혀지고 있다.
Moore's Law and Dennard Scaling have guided the semiconductor industry for the past few decades. Recently, both laws have faced validity challenges as transistor sizes approach the practical limits of physics. We are interested in testing the validity of these laws and reflect on the reasons responsible. In this work, we collect data of more than 4000 publicly-available CPU and GPU products. We find that transistor scaling remains critical in keeping the laws valid. However, architectural solutions have become increasingly important and will play a larger role in the future. We observe that GPUs consistently deliver higher performance than CPUs. GPU performance continues to rise because of increases in GPU frequency, improvements in the thermal design power (TDP), and growth in die size. But we also see the ratio of GPU to CPU performance moving closer to parity, thanks to new SIMD extensions on CPUs and increased CPU core counts.
연구 동기 및 목표
- 현대의 CPUs와 GPUs에서 Moore’s Law와 Dennard Scaling이 여전히 타당한지 평가한다.
- 주파수, TDP, 다이 크기를 포함한 GPU 성능의 구동 요인을 정량화한다.
- CPU와 GPU의 이론적 계산 능력을 비교하고 수렴 또는 발산의 원인을 규명한다.
- MCM 패키징, DVFS, 클록 게이팅과 같은 아키텍처적 추세가 스케일링 추세를 지속하는 데 미치는 영향을 평가한다.
제안 방법
- 공개 사양에서 2000년 이후 출시된 4031개 제품(2102개 CPU, 1929개 GPU)의 데이터를 수집한다.
- 각 제품의 출시일, 공정 크기, 다이 크기, 트랜지스터 수, 기본 주파수, 그리고 TDP를 기록한다.
- CPU의 코어와 SIMD 기능을 고려하여 기본 주파수를 사용해 이론적 단정밀도와 배정밀도 FLOPS를 계산한다.
- 원시 성능과 에너지 효율 성능의 지표로 TFLOPS 및 TFLOPS per watt를 사용한다.
- 다칩 모듈(MCM) 및 통합 CPU-GPU 장치를 명시된 대로 처리하고, 계산을 위한 적절한 집계 규칙을 적용한다.
- 제한점으로 2014년 이후 인텔의 트랜지스터/다이 데이터가 누락되었고, 자세한 트랜지스터/다이 분석은 GPU 데이터에 집중한다는 점이 언급된다.

실험 결과
연구 질문
- RQ1현대의 CPU와 GPU에서 Moore’s Law가 여전히 타당한가, 그리고 이를 유지시키는 요인은 무엇인가?
- RQ2GPU가 CPU에 비해 여전히 계산 성능 우위를 유지하는가, 그리고 CPU-GPU 격차가 확대되고 있는가 축소되고 있는가?
- RQ3GPU의 성능 향상을 주도하는 요인들(예: 주파수, 다이 크기, TDP)은 무엇이며, 이것들이 효율성과 어떻게 관련되는가?
주요 결과
- 트랜지스터 축척은 시간이 지나도 칩당 트랜지스터 수를 증가시키는 모습을 계속 보여주어 CPU와 GPU 모두를 위한 Moore’s Law를 지지한다.
- GPU 다이 크기는 시간이 지남에 따라 커져 왔으며, 축척 그 이상으로 더 높은 트랜지스터 수에 기여한다.
- Dennard Scaling은 부분적으로 여전히 타당하지만 새로운 노드에서 압박을 받는다; 트랜지스터당 에너지는 여전히 감소하지만 일부 노드에서 에너지 밀도 문제가 나타난다.
- 단정밀도에서 GPU의 성능은 여전히 CPU보다 상당히 높지만, CPU는 SIMD 확장과 더 많은 코어를 통해 격차를 줄였다.
- GPU 에너지 효율성(FLOPS per watt)은 빠르게 개선되며, FLOPS per watt가 대략 3–4년마다 두 배로 증가하는 반면 고급 GPU는 TDP가 증가하고 있다(약 300W 전후).
- 주파수 증가가 GPU 성능 향상의 주요 원동력이며, 세대 간에 큰 도약이 발생한다(예: 2016년).
- 배정밀도에서 GPU의 CPU에 대한 성능 차이는 시장 주도적 GPU 설계(게임 vs HPC)와 CPU SIMD 발전으로 인해 크게 차이가 나며, 직접적인 비교는 미묘하다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.