728x90


 

한국 시각으로 지난 14일 오전 6시, AMD 테크 서밋 행사를 무대로 Zen 아키텍처의 시제품이 '마침내' 공개되었다. 무려 5년만의, AMD의 하이엔드 시장 복귀작이 될 그것의 이름은 ‘라이젠Ryzen’. 아키텍처명을 마지막 음절로 이어붙이며 rise의 과거분사형 risen, 혹은 ‘rise and…’ 등을 연상시키는, 언어유희를 다분히 의도한 이름이라 하겠다.

 

아직까지는 라이젠 이름을 달고 나올 SKU 중 하나가(아마도 최상위 모델일 것이) 8코어, L2/L3 도합 20MB의 캐시, ‘최소한’ 3.4GHz의 작동속도를 가질 것이라는 사실밖에 알려지지 않았다. 제조사들의 흔한 레토릭에 대입하자면 이러한 모호한 스펙 정보는 '아직 간을 보고 있다’ 로 번역할 수 있다. 카운터파트인 인텔의 움직임에 따라, 경우에 따라서는 파운드리의 사정 등에 따라 막판 정무적 판단이 개입될 여지를 열어둔 것으로 봐도 좋겠다.

 

아, 그렇더라도 TDP가 95W라는 것 자체는 불변의 상한선으로 봐도 무리가 없을 것이다. 모두의 이목 앞에서 인텔 코어 i7 6900K를 경쟁 상대로 지목한 만큼 그보다는 가격이 저렴할 것이라는 데에도 기꺼이 내 돈 천원을 건다.

 

0024.jpg

 

라이젠은 새로운 AM4 플랫폼을 사용하는 AMD의 첫 하이엔드 데스크탑 CPU이다. 플랫폼 자체는 지난 9월 출시된 브리스톨 릿지와 쌍을 이뤄 시장에 소개된 바 있지만 OEM 위주로 공급된 탓에 제대로 된 데뷔로 보긴 어려웠다. 메인보드 칩셋과 CPU의 융합이라는 화두를 처음 제시한 AMD였지만(K8에서 과거 노스브릿지의 주요 기능인 메모리컨트롤러를 통합) 메모리컨트롤러를 제외한 나머지 부분까지의 통합은 오히려 경쟁사 인텔이 한발 앞서 이뤄낸 바 있는데(린필드에서 잔여 노스브릿지 기능의 핵심인 PCIe 컨트롤러를 흡수), AMD가 이와 비슷한 수준의 통합을 이루기까지는 그로부터도 5년이라는 시간이 더 걸렸고, 2014년 카리조 APU가 마침내 노스브릿지 대부분과 사우스브릿지를 흡수하기에 이른 것이다.

 

0004.jpg

 

이때만 하더라도 ‘원 칩 플랫폼’의 이상은 APU에서만 가까워졌고 하이엔드 데스크탑 CPU는 2012년에 출시된 파일드라이버를 끝으로 업데이트가 없었는데, 그러니 말하자면 하이엔드 데스크탑 CPU로서는 만 4년만의, 하이엔드 데스크탑 플랫폼으로서는(데네브와 함께 선보인 AM3 이후) 무려 8년만의 업데이트인 셈이다. CPU의 노스브릿지 통합이라는 구조적 측면에서는 2003년 K8 이후 거의 13년만의 변화라고도 볼 수 있다. 같은 기간 인텔은 짧게 잡아도(4년) 샌디브릿지에서 스카이레이크를, 길게 보면 넷버스트에서 스카이레이크를 만들어내고도 몇 개월이 남았으니 AMD의 더딘 진화를 새삼 실감할 수 있을 것이다.

 

0010.jpg

 

AMD에 따르면 AM4 플랫폼은 USB 3.1 Gen 2, NVMe, SATA-Express 등 최신 입출력 규격을 지원하며 재미있게도 ‘브리스톨 릿지보다는 더 많은’ PCIe 라인을 지원할 것이라고 한다. 상술했듯 메인보드 칩셋 레벨에서 차별화할 부분이 거의 남아있지 않기에 CPU 레벨에서 라이젠과 그 하위 모델의 부가기능을 차등화해 두었으리라 짐작된다. 혹은 인텔의 칩셋 정책처럼 메인보드의 가격대별로 선택적으로 일부 기능(PCIe 라인 수, RAID 지원여부 등)을 개폐하리라는 추측도 가능하다. 분명한 것은 똑같은 메인보드의 껍데기를 뒤집어쓰더라도 브리스톨 릿지 시스템과 라이젠 시스템의 잠재력은 분명히 다르다는 점이다.

 

다만, 구체적으로 몇 개의 PCIe 라인을 지원하는지 등은 아쉽지만 아직 베일에 가려져 있다. 다만 시연회장에서 인텔 코어 i7 6900K를 비교 대상으로 지목했고(해당 모델은 40개의 PCIe 라인을 지원한다), 엔비디아 타이탄 X SLI(현존하는 구성 중 가장 많은 PCIe 대역폭을 요구한다)를 나란히 시연한 것 등으로 미뤄 볼때 최소한 ‘그에 준하는 성능’을 끌어낼 여건은 마련했으리라는 것이 다수의 추측이다.

 

rysen_01.jpgrysen_02.jpg

 

시연회장에서는 이외에도 렌더링(블렌더/좌), 비디오 인코딩(핸드브레이크/우) 등의 벤치마크 데모를 선보였는데 ‘주최측인 AMD가 선별한’ / ‘한정적인’ 항목에서의 결과값인 만큼 액면 그대로 받아들이는 것을 지양하더라도 코어 i7 6900K보다 소폭이나마 일제히 더 높은 성능을 보인 것은 분명 주목할 만하다.

 

스크린샷 2016-12-20 오전 4.35.38.png

(이미지 출처 : WCCFTech)


심지어 코어 갯수가 현저히 차이나는 상황임을 감안하더라도, 4.5GHz로 오버클럭된 코어 i7 7700K에 비해 라이젠 8코어 3.4GHz 샘플의 게이밍/스트리밍 동시 시연 데모가 확연히 더 부드럽게 구동되어 ‘체감될 정도의’ 성능 차를 벌렸음을 알렸다. 이후 외신으로부터 하나둘 공개된 별건의 벤치마크 결과를 보더라도, 대체로 5GHz로 오버클럭된 코어 i7 7700K와 i7 6900K의 사이에 해당하는 성능을 보여, 같은 코어 수를 갖던 FX와 더 이상 비교할 수준이 아님을 과시했다.

 

0013.jpg

 

이에 관해서는 작년 5월의 파이낸셜 애널리스트 데이Financial Analyst Day 행사에서부터 일관되게 AMD가 밝힌 바 있는 ‘전세대 대비 40%의 IPC 상승’을 돌아봐야 할 것 같다. 이변이 없는 한 이것이 현실화된 것으로 여겨지는 지금, 라이젠에 사용된 Zen 아키텍처는 과연 종전까지의 불도저 시리즈와 비교해 어떤 점이 달라졌기에 이토록 큰 폭의 성능향상을 단번에 이끌어낸 것일까.

 

0012.jpg

 

Zen 아키텍처 자체에 관한 상세한 분석은 이 글(링크)을 참고하시고, 여기서는 AMD가 거시적 레벨에서 강조하고자 하는 다섯 가지 특징을 간략하게 정리해 소개하고자 한다. 바로 센스MISenseMI라는 기술 모음이다.

 

0014.jpg

 

그 첫번째는 퓨어 파워Pure Power. 기술 자체는 완전히 새로운 것은 아니고, 카리조에서 시범적으로 도입되었던 ‘프로세서 회로 사이사이 배치된 임베디드 센서를 통한 전압/온도 실시간 모니터링 체계’를 계승한 것에 가깝다. 이것이 성능-소비전력 곡선을 상향시키는 데 일조했다면 재차 곡선을 우향시키는 데 사용된 기술은 프리시전 부스트Precision Boost. 기존까지 100MHz 단위로 경직된 시나리오를 갖던 클럭 부스트 메커니즘이 25MHz 단위로 섬세해지고 그 알고리즘 역시 개량된 것이다. 상술한 두 기술이 맞물리면서 Zen의 성능-소비전력 곡선은 처음보다 뚜렷하게 우상향하게 되었다.

 

0015.jpg0016.jpg

 

상술한 두 기술이 반도체의 전기적 특성 자체를 손본 것이라면 다소 소프트웨어적인 응용이 바로 세번째 기술, XFR(Extended Frequency Range) 되겠다. 소비전력이나 발열이 일정 수준 이상일 때 작동 속도를 ‘낮추는’ 예방적 방향으로서만 기능했던 작동 속도 제어 메커니즘을 그 정반대의 상황에까지 확장한 것이다. 즉 발열이 미리 예정된 시나리오보다 훨씬 낮게 유지될 경우(=쿨링에 힘 좀 준 경우) CPU의 작동 속도는 원래 예정된 발열 시나리오의 허용치까지 높아진다. 오직 유저의 수작업으로만 가능했던 오버클럭을 자동화의 영역에 끌여들인 것이라 할 수 있다.

 

전문가의 손 맛과 XFR 중 어느 것이 더 효과적일지는 차차 지켜봐야 할 흥미로운 포인트 중 하나. 다만 작동 속도 제한을 사실상 풀어 버린다는 점에서 모든 SKU에 적용될 것으로 보기는 어렵다는 설도 존재한다. 이 경우 인텔의 K 모델처럼 특정 최상위 SKU에만 제한적으로 허용되는 옵션일 가능성이 높겠다.

 

0017.jpg

 

앞선 세 가지 기술이 어쨌든 반도체 전역에 적용되는 거시적 터치라면 마지막 둘은 미시적인, 아키텍처 레벨에서의 개선을 다룬다. 바로 신경망 예측Neural Net Prediction과 스마트 프리페치Smart Prefetch. Zen이 전세대 아키텍처에 비해 특히 심혈을 기울여 개선한 부분이 프론트엔드라는 점에서 유추할 수 있듯 이들은 모두 프론트엔드에 적용된 기술들이다.

 

신경망 예측은 CPU에 주입된 프로그램 코드의 행태를 추적/구축하여 가장 ‘그럴싸하게’(maximum likelyhood) 행동함직한 분기를 찾는 한편 CPU 내부에서의 최적의 처리 경로를 제시하는(예컨대 디코드가 예상될 경우 아이들 상태에 있는 디코더를 한발 앞서 워밍업해 둔다든지, 특정 마이크로옵을 어떤 연산유닛에 배정하는 경우 가장 빨라지는지를 예측한다든지) 기술이다.

 

현 단계에서는 자주 발생하는 경우를 빠르게 처리하기 위해 어느 정도는(간단한 분기의 경우) 물리적인 모델링이 구현되었을 것으로 짐작하는 정도이며, 복잡다단한 프로그램의 분기를 어떻게 내부적으로 (모델을) 구축해 시뮬레이션 할지는 미스테리로 남은 부분이다.

 

0018.jpg

 

스마트 프리페치는 필요할 것으로 예상되는 데이터를 적시에 공급해 주기 위한 큐레이션/캐싱 알고리즘에 가깝다. 흔히 캐싱 알고리즘이 공격적으로 짜일 경우 불필요한 데이터 흐름 역시 증가하는 경향이 있는데(예 : 캐시를 자주 비우고 자주 채워넣는다) 이를 막기 위해 ‘알고리즘 러닝 모델’을 내부적으로 구현했다. 이와 관련, 종전까지의 AMD 프로세서와 달리 L3 캐시의 역할을 빅팀 캐시로 규정한 것이 바로 스마트 프리페치의 원활한 구동을 위해서라는 설이 있다.

 

종전까지 AMD의 캐시 정책은 '배타적 캐시Exclusive Cache'로, L1부터 L3에 이르는 전 층위의 캐시가 중첩 없는 하나의 거대한 캐시처럼 사용되었지만, 빅팀 캐시 체제에서 L3 캐시는 L2 캐시에서 ‘방출된’ 데이터만을 담아 두게 된다. 즉 캐시 비움/채움이 빈번하게 이뤄지는 경우 가장 시너지를 발휘할 수 있는 구조이다.

 

0019.jpg

 

모두가 궁금해 할 라이젠의 출시일정은 2017년 1분기 중, 세부 SKU나 가격은 아직 미정. 실로 오랜만에 하이엔드 데스크탑 CPU 시장에서 ‘경쟁’이란 해묵은 단어를 꺼내볼 수 있게 되어 반갑다. 사는 동안 설마 다시 볼까 싶었지. 그렇잖아도 최근 강세를 보이던 AMD의 주가는 이날의 발표 이후 무려 6.6% 급등, 현재 실로 오랜만의 두자릿수 가격을 찍고 있다(12월 20일 현재 10.94달러).

 

올해를 장식할 것으로 기대되었던 AMD의 두 화살 중 하나인 라이젠이 베일을 벗은 가운데, 라데온 테크놀러지 그룹의 명예가 걸린 베가에 슬그머니 연말의 시선이 쏠리기 시작한다. 올해도 이제 열흘 남짓밖에 남지 않았다.


출처: http://drmola.com/pc_column/112977

작정자:  Dr.Lee 님


반응형

+ Recent posts