본문 바로 가기

[ 테크 ]

성능 차별화는 메모리 접근성에서
-애플 실리콘 M1과 AMD RDNA2의 전략

by김국현

이달 쏟아져 나온 신제품들의 성능이 예사롭지 않다.


애플 실리콘 M1의 가공할 퍼포먼스가 화제가 되고 있는 와중에 기다려온 AMD의 신제품 RDNA2(코드명 Big Navi) 제품군도 모습을 드러냈다. 경쟁사 엔비디아의 신제품들이 워낙 잘 나와서 AMD가 걱정스러웠는데, 뚜껑을 열어보니 엔비디아 신제품보다 저렴하면서도 성능은 나쁘지 않다. 이게 웬일인가.


플레이스테이션5와 엑스박스 시리즈 X 등 신형 콘솔이 AMD의 RDNA2를 다 같이 채택한 데에는 다 계획이 있었던 모양이다.


명세상으로 보면 AMD의 신제품 시리즈 라데온 RX 69/6800 시리즈는 먼저 치고 나온 엔비디아 RTX 3090/3080 시리즈에 뒤처져 보였다.


AMD는 트랜지스터 수가 268억 개인데 반해 엔비디아는 280억 개였다. 메모리 대역폭도 엔비디아보다 좁아 256비트 버스뿐이다. 대신 공정은 비슷해서 (AMD는 TSMC 7나노, 엔비디아는 삼성의 8나노) 다이(die) 사이즈는 더 작았고 가격도 엔비디아보다 한층 더 저렴했다.


그런데 성능 벤치마크는 엎치락뒤치락 백중세(伯仲勢)였다. 그 비결로 여러 가지가 거론되었으나 '인피니티 캐시(Infinity Cache)’를 빼놓을 수 없다.


GPU에게 최대의 병목은 메모리다. 엔비디아의 발표에서도 자신의 그래픽 메모리가 얼마나 빠른지 강조했다. 하지만 메모리 대역폭을 마냥 늘리는 것은 쉽지 않다. 그만큼 회로가 복잡해지고 표준화 문제도 걸린다.


해결법은 있다. 최대한 메모리를 프로세서 가까이 옮겨서 바로 이어 버리거나, 또는 프로세서 옆에서 잠시 담아 놓고 쓸 메모리의 용량을 늘려 메모리로의 셔틀 왕복을 줄이는 것이다.


RDNA2에는 무려 128MB나 되는 대용량 캐시를 탑재했는데, 이 기술은 AMD의 서버 CPU ‘EPYC’의 캐시기술이 유용된 것이다. (캐시란 메인 메모리의 내용 중 당장 처리할 것을 잠시 담아두는 고성능 메모리) 캐시가 효율이 높아지니 데이터 이동에 드는 에너지도 속도도 대폭 줄어들게 된다.


그리고 자사의 라이젠 CPU와 칩셋을 쓰는 경우 CPU가 GPU 메모리 전역에 무제한 풀 액세스할 수 있는 스마트 액세스 메모리(Smart Access Memory) 기능을 도입해서 시너지를 높였다.

성능의 열쇠는 메모리 접근성이라는 듯했다.


한편 애플의 M1은 마치 캐시를 박아넣듯이 주메모리를 프로세서에 삽입해 버렸다. 옛날 생각이 난다. 지금은 당연히 CPU 다이 안에 함께 찍혀 나오는 캐시 메모리도 예전에는 별도의 작은 반도체로 CPU 패키지 속에서 회로로 이어져 있던 시절(펜티엄2)이 있었다.


M1의 외모는 마치 CPU 패키지를 칼로 반으로 썰고 나머지 반에 하이닉스에서 만든 DRAM를 담아 함께 포장한 모양새다. 어차피 이 메모리는 CPU, GPU, 그리고 인공지능 뉴럴 엔진이 공유할 터이니 할 수만 있다면 밖으로 뺄 이유가 없었던 것.


SoC(시스템 온 칩), 그러니까 CPU나 메모리 등 주요 반도체를 하나의 칩에 구현해 칩 자체를 하나의 시스템으로 만드는 일은 스마트폰의 도래와 함께 일상이 되었지만, 마더보드에 익숙한 PC 애호가들의 눈에는 낯설다. 취향에 맞게 메모리를 확장하는 시대가 아니라, CPU 형번에 따라 주메모리의 선택지도 고정되는 시대가 찾아오고 있다.


이렇게 메모리를 공유하는 구조를 통합 메모리 아키텍처(UMA)라고 한다. 통합 메모리라고 하면 통합 그래픽의 곤궁한 열악함이 떠오를 수 있지만, 이 또한 상식이 바뀌고 있다. 만약 CPU와 GPU가 메모리를 공유할 수 있다면, 특히나 같은 칩 안에서 공유한다면 좋은 일이 많다. CPU와 GPU 사이로 데이터를 이리저리 옮길 필요가 사라져서다.


프로그램이란 GPU만으로는 완결될 수 없고, 결국은 CPU가 일해야 하는 법. 인공지능 등 다양한 용도에서도 이 두 프로세서 간의 데이터 운반은 큰 과제였다. 모든 것이 하나의 칩 안에 들어앉은 채 반출할 필요가 사라진다면 당연히 속도는 빨라질 수밖에 없다.


‘버스’ 타고 출퇴근하는 것보다 재택근무가 시간을 아낄 수 있다.


그건 그렇고 스마트폰의 메모리 용량을 확장할 수 없듯이 이제 컴퓨터도 메모리 증설은 구매 이후에는 할 수 없는 시대가 오고 있다. 모든 것은 개선된 성능이 용서해줄 것이라 제조사들은 믿고 있다.