반도체 격전지 HBM 이어 낸드도 "쌓는다"…초대형AI 시대, 차세대 메모리 HBF 부상

    고객센터이미지
    토토힌트 이벤트

반도체 격전지 HBM 이어 낸드도 "쌓는다"…초대형AI 시대, 차세대 메모리 HBF 부상

하이커뮤니티매니져 0 4 08:25







차세대 AI 메모리인 고대역폭플래시(HBF)는 D램보다 속도는 느리지만 용량이 큰 낸드 플래시(NAND Flash)를 3차원으로 쌓은 소자다. 인공지능(AI) 추론 능력 향상에 특히 도움이 될 것으로 기대된다. 게티이미지뱅크 제공



차세대 AI 메모리인 고대역폭플래시(HBF)는 D램보다 속도는 느리지만 용량이 큰 낸드 플래시(NAND Flash)를 3차원으로 쌓은 소자다. 인공지능(AI) 추론 능력 향상에 특히 도움이 될 것으로 기대된다. 게티이미지뱅크 제공




인공지능(AI)이 다루는 데이터와 AI 추론 모델 등의 규모가 점점 커지면서 이를 뒷받침할 하드웨어 발전 필요성도 높아지고 있다. AI 기술 구현에 적합한 장치인 그래픽처리장치(GPU)의 성능을 끌어올리기 위해 정보 전달을 돕는 '고대역폭메모리(HBM)'의 등장은 국내 반도체 기업 SK하이닉스에 메모리반도체 시장 주도권을 안겨주기도 했다. HBM은 속도가 빠른 메모리반도체인 D램을 3차원으로 쌓아 만든 소자다.





HBM만으로는 GPU의 연산 속도를 따라가지 못한다는 평가가 나오면서 올해 여름을 기점으로 새로운 메모리반도체인 '고대역폭플래시(HBF)'가 차세대 목표로 제시됐다. HBF는 D램보다 속도는 느리지만 용량이 큰 낸드 플래시(NAND Flash) 메모리를 HBM처럼 3차원으로 쌓아 구멍을 뚫고 엘리베이터 같은 연결 통로를 설치해 통합하는 개념이다. 올 8월 SK하이닉스와 샌디스크는 삼성전자 등 경쟁사보다 HBF 표준을 선점하기 위해 손을 잡았다.



4일 대전 KAIST에서 만난 김정호 KAIST 전기전자공학부 교수는 "삼성전자, SK하이닉스의 실적이 지금은 HBM에 달렸지만 10년 후에는 HBF가 좌우할 것"이라고 강조했다. 그는 "HBF는 HBM과 기본 기술부터 공정 장비까지 대부분 재활용 및 공유되기 때문에 개발 속도가 매우 빠를 것"이라며 첫 HBF 등장은 2027년, HBF가 탑재된 GPU 등 완제품은 2028년 출시될 것으로 예상했다.






● HBM은 책장, HBF는 도서관 역할





GPU는 병렬 처리 연산에 특화된 프로세서로 AI의 학습이나 추론에 적합하다. HBM은 GPU 연산에 필요한 데이터와 연산 결과를 빠르게 주고받으며 AI 성능을 높인다. 기존 메모리의 한계로 HBM이 등장했지만 지금도 AI 작업을 수행할 때 GPU가 계산하는 시간 점유율은 약 20~30%에 그친다. 메모리에 '병목 현상'이 있다는 뜻이다. 김 교수는 "AI 성능이 메모리에서 좌우된다"며 "미국 엔비디아에서 GPU가 새로 나오더라도 메모리 혁신이 필요하다는 뜻"이라고 말했다.










GPU와 HBM, HBF의 구조 설계 예시. GPU는 HBM과, HBM은 HBF와 데이터를 주고받는다. HBM이 자주 쓰는 정보를 두는 책장이라면 HBF는 도서관에 비유된다. 김정호 교수 제공



GPU와 HBM, HBF의 구조 설계 예시. GPU는 HBM과, HBM은 HBF와 데이터를 주고받는다. HBM이 자주 쓰는 정보를 두는 책장이라면 HBF는 도서관에 비유된다. 김정호 교수 제공




HBF는 HBM의 대체재가 아닌 추가 요소 개념이다. 역할은 비슷하지만 조금 다르다. HBM이 처리할 수 없는 대용량 데이터는 네트워크로 연결된 데이터센터에서 전송된다. HBF의 역할은 데이터센터 일부를 가져와 GPU 옆에 붙여주는 것이다. GPU는 HBM과, HBM은 HBF와 데이터를 주고받는다. HBM이 자주 쓰는 정보를 두는 책장이라면 HBF는 도서관에 비유된다.





김 교수는 "HBF는 HBM에 비해 속도는 상대적으로 느리지만 용량은 10~100배 크다"며 "특히 AI 학습보다 추론 능력에 도움이 될 것"이라고 설명했다. HBF가 적용되려면 GPU가 연산할 때 HBF까지 활용하도록 소프트웨어 체계도 발맞춰 업그레이드돼야 한다.






● 낸드 수명 극복 숙제…전력 절감은 근본적 한계 있어





낸드는 강한 전압을 가해 전자가 평소에 넘기 어려운 장벽을 뚫도록 유도해 '플로팅 게이트'라는 공간에 가둔 다음 전자의 유무로 정보를 정의한다. 현존 낸드 기술은 전자를 가둬 정보를 기록하는 '쓰기' 과정이 반복되면 소재 결함 등이 자연적으로 발생해 오류가 난다. 횟수 제한이 없는 D램과 달리 낸드는 쓰기를 약 10만 번 하면 수명을 다한다.





김 교수는 "과학자들이 새로운 소재와 구조를 찾아내 해결해야 할 부분"이라며 "D램보다 용량이 크면서 횟수 제한 없이 빠르게 동작하는 새로운 소자가 등장할 수도 있다"고 말했다.





김 교수 연구실 인력의 절반은 HBM, 절반은 HBF를 연구한다. 학생들은 AI의 작동 원리를 이해해야 최적의 메모리반도체 구조를 구현할 수 있다는 관점으로 접근한다. 동시에 AI를 HBM과 GPU의 연결성을 높이는 성능 고도화와 HBF 구조 설계에 다시 활용한다.





AI 발전으로 인한 전 세계적인 전력 사용량 증가에 대해서는 근본적인 한계가 제시됐다. 실리콘 소재 기반에서 컴퓨터가 연산장치, 메모리, 프로그램 3가지로 구성된 컴퓨터 구조인 '폰노이만 구조'를 따르는 이상 저전력 소자 등을 구현하더라도 전력 소모를 줄이는 데 제약이 있다는 것이다.





김 교수는 "AI 서비스를 제공하는 기업들이 우리 삶에 필수적인 AI 앱을 출시하기 시작하면 사용자들이 구독 형태로 돈을 지불해 전력 생산 비용을 충당할 수 있을 것"이라고 전망했다.







https://m.dongascience.com/news.php?idx=75031


, , , , , , , , , , , , , , , , , , , ,

Comments

포디움
종목별 팀순위
포디움

순위 경기 승점
1 리버풀 19 12 6 1 42
2 아스널 18 12 4 2 40
3 애스턴 빌라 19 12 3 4 39
4 토트넘 18 11 3 4 36
5 맨시티 17 10 4 3 34
6 맨유 19 10 1 8 31
7 웨스트햄 18 9 3 6 30
8 뉴캐슬 19 9 2 8 29
9 브라이튼 18 7 6 5 27
10 본머스 18 7 4 7 25
11 첼시 18 6 4 8 22
12 울버햄튼 18 6 4 8 22
13 풀럼 19 6 3 10 21
14 브렌트포드 17 5 4 8 19
15 크리스탈 팰리스 18 4 6 8 18
16 노팅엄 포레스트 19 4 5 10 17
17 에버턴 18 8 2 8 16
18 루턴 18 4 3 11 15
19 번리 19 3 2 14 11
20 셰필드 19 2 3 14 9