“웨이퍼 규모” CPU가 슈퍼컴퓨터를 혁신하는 방법

0
311

실리콘 웨이퍼로 제조되는 마이크로 회로.
asharkyu/Shutterstock.com

CPU는 더 작아진 구성 요소 덕분에 수년에 걸쳐 더 빨라졌습니다. 그러나 우리가 얼마나 작은 회로에 도달할 수 있는지 한계를 향해 나아가고 있는 지금 우리는 어디로 가야 할까요? 한 가지 대답은 칩을 “웨이퍼 스케일” 크기로 만드는 것입니다.

“웨이퍼 스케일”이란 무엇입니까?

CPU와 같은 집적 회로 장치는 실리콘 결정으로 만들어집니다. 장치를 만들기 위해 거대한 원통형 실리콘 결정이 원형 웨이퍼로 슬라이스됩니다. 그런 다음 여러 칩이 웨이퍼 표면에 에칭됩니다. 칩이 완성되면 결함이 있는 장치를 찾기 위해 테스트를 거쳐 표시됩니다.

CPU는 실제로 어떻게 만들어지는가?

관련된CPU는 실제로 어떻게 만들어지는가?

웨이퍼에서 작업 칩을 잘라내어 최종 제품으로 포장하여 판매합니다. “수율”은 웨이퍼에서 나오는 작업 칩의 수입니다. 칩의 고장이나 오프컷으로 인해 낭비되는 웨이퍼의 모든 부분은 작동 중인 칩으로 번 돈으로 회수해야 합니다.

웨이퍼 스케일 칩은 전부의 단일 프로세서용 웨이퍼. 좋은 생각처럼 들리지만 몇 가지 심각한 문제가 있었습니다.

웨이퍼 스케일 칩은 불가능해 보였습니다.

수년 동안 전체 실리콘 웨이퍼를 “통합”하려는 몇 가지 시도가 있었습니다. 문제는 마이크로칩을 만드는 데 사용되는 공정이 불완전하다는 것입니다. 완성된 웨이퍼에는 결점이 있기 마련입니다.

웨이퍼에 동일한 칩의 복사본을 여러 개 인쇄한 경우 몇 개의 깨진 부품이 세상의 끝이 아닙니다. 그러나 단일 CPU가 작동하려면 흠이 없어야 합니다. 따라서 전체 웨이퍼를 통합하려고 하면 이러한 피할 수 없는 결함으로 인해 전체 거대한 칩이 쓸모 없게 될 것입니다.

이 문제를 해결하기 위해 엔지니어는 통합 장치로 작동하도록 설계된 대규모 프로세서를 설계하는 방법을 재고해야 했습니다. 지금까지 단 하나의 회사만이 제대로 작동하는 웨이퍼 스케일 프로세서를 만들 수 있었고, 이를 실현하려면 심각한 기술 문제를 해결해야 했습니다.

세레브라스 WSE-2

세레브라스 WSE-2
대뇌

Cerebras Systems의 Wafer-Scale Engine 2는 절대적으로 거대한 칩입니다. 스마트폰, 노트북, 데스크탑 등 다양한 기기에 들어가는 7나노, 5나노 칩과 유사한 7나노 공정을 사용한다.

CPU에서 "7nm"와 "10nm"는 무엇을 의미하며 왜 중요한가요?

관련된CPU에서 “7nm”와 “10nm”는 무엇을 의미하며 왜 중요한가요?

WSE-2는 고속 상호 연결의 거대한 그리드에 의해 모두 서로 연결된 코어 메쉬로 설계되었습니다. 이 프로세서 코어 모듈 네트워크는 일부 코어에 결함이 있더라도 모두 통신할 수 있습니다. WSE는 각 웨이퍼의 예상 수율에 따라 광고된 것보다 더 많은 코어가 있는 방식으로 설계되었습니다. 즉, 모든 칩에는 결함이 있지만 설계된 성능에는 전혀 영향을 미치지 않습니다.

WSE-2는 “딥 러닝”으로 알려진 기계 학습 기술을 사용하는 AI 애플리케이션을 가속화하도록 특별히 설계되었습니다. 딥 러닝 작업에 사용되는 현재 슈퍼컴퓨터와 비교할 때 WSE-2는 전력을 덜 사용하면서 훨씬 더 빠릅니다.

웨이퍼 스케일 CPU의 장점

측면 패널이 열린 Cerebras 컴퓨터 시스템
대뇌

웨이퍼 규모 CPU는 현재 슈퍼컴퓨터 설계의 많은 문제를 해결합니다. 슈퍼컴퓨터는 네트워크로 연결된 더 작고 단순한 컴퓨터로 구성됩니다. 이러한 유형의 설계에 대한 작업을 신중하게 설계함으로써 모든 컴퓨팅 성능을 함께 추가할 수 있습니다.

그러나 해당 슈퍼컴퓨터 어레이의 각 컴퓨터에는 자체 지원 구성 요소가 필요하며 해당 네트워크의 여러 개별 CPU 패키지 사이의 거리를 늘리면 많은 성능 문제가 발생하고 실시간으로 수행할 수 있는 작업 부하 유형이 제한됩니다.

거대한 슈퍼컴퓨터는 여전히 존재합니다.  이것이 오늘날 사용되는 것입니다.

관련된거대한 슈퍼컴퓨터는 여전히 존재합니다. 이것이 오늘날 사용되는 것입니다.

웨이퍼 크기의 CPU는 수십 또는 수백 대의 컴퓨터 처리 능력을 단일 섀시에 모두 수용된 하나의 전원 공급 장치로 구동되는 단일 집적 회로로 효과적으로 결합합니다. 더 나아가 여러 웨이퍼 규모의 컴퓨터를 네트워크로 연결하여 기존의 슈퍼컴퓨터를 만들 수 있지만 기하급수적으로 더 빠릅니다.

우리 모두를 위한 웨이퍼 규모 CPU?

우리는 슈퍼컴퓨터를 만들려고 하지 않는 일반 사용자를 위한 웨이퍼 크기의 제품을 얻지 못할 것입니다. 하지만 소비자 전자 제품에도 분명히 나타나는 “더 큰 것이 더 낫다”는 철학의 요소가 있습니다.

Apple의 M1 Ultra SoC(system-on-a-chip)는 고속 상호 연결로 연결된 두 개의 M1 Max SoC로, 리소스가 두 배인 단일 시스템으로 표시됩니다.

AMD의 CPU 설계는 또한 독립적으로 만든 다음 다른 유형의 고속 상호 연결을 사용하여 함께 “접착”할 수 있는 CPU 코어 유닛인 “칩렛”을 활용했습니다. 이제 회로가 CPU에서 더 이상 작아지는 것을 멈출 수 있으므로 오늘날 우리가 사용하는 보다 일반적인 2D 회로가 아닌 복잡한 3D 회로 설계를 사용하여 회로를 구축하고 아마도 그 이상으로 구축해야 할 때입니다.

관련된: Apple의 M1 Ultra 칩은 Mac 데스크탑을 더욱 강력하게 만들 것입니다.