‘지능형 메모리’성능 11배 높였다… 로봇-AI 등 분야 새 전기
최근 로봇, 인공지능, 빅데이터, 생명과학 등 다양한 분야에서 고성능 컴퓨팅 자원이 요구되고 있으며, 이에 따라 메모리 내부에 연산장치를 배치하는 ‘프로세싱-인-메모리(PIM, Processing-in-Memory)’ 반도체에 대한 연구개발이 활발하다.
국내 연구진을 포함한 국제 공동 연구진이 기존의 PIM 반도체의 성능을 큰 폭으로 높일 수 있는 기술을 새롭게 개발했다. 고성능 컴퓨터 자원이 필요한 다양한 제품군에 큰 성능 향상이 기대된다.
한국과학기술원(KAIST) 전기및전자공학부 김동준 교수 연구팀은 미국 노스이스턴 대학(Northeastern Univ), 보스턴 대학(Boston Univ), 스페인 무르시아 대학(Universidad de Murcia)의 저명 연구진과 ‘PIM 반도체 간 집합 통신에 특화된 ‘인터커넥션 네트워크 구조’를 공동으로 개발했다고 19일 밝혔다.
기존 PIM은 통신을 할때 반드시 컴퓨터의 중앙처리장치(CPU)를 통해야한다는 구조적 문제점이 있어 데이터 처리과정에서 병목현상이 발생하는 것을 피할 수 없었다. 반면 연구진이 새롭게 제안한 구조는 이런 문제가 해결할 수 있어 성능을 극대화 할 수 있다.
김동준 교수팀은 기존에 메모리 내부에 존재하는 데이터 이동을 위한 버스 구조를 최대한 활용하면서 각 연산장치를 직접적으로 상호 연결하는 방식을 이용해 새로운 구조를 개발했다. 인터커넥션 네트워크(interconnection network) 구조는 다중 연산 장치를 포함하는 대규모 시스템 설계에 쓰이는 연산 장치 간 연결 구조를 말하며, 시스템 규모가 커질수록 더욱 중요해지는 특징이 있다.
공동 연구진은 이를 이용해 PIM 반도체를 위한 연산 과정에서 통신 처리를 위한 CPU의 개입을 최소화했다. 또 PIM 반도체 시스템의 전체적인 성능과 활용성을 높인 PIM 반도체에 특화된 새로운 인터커넥션 네트워크 구조 개발했다.

▲ 한국과학기술원(KAIST) 김동준 교수 연구팀이 제안하는 ‘PIM 특화 인터커넥트 구조’를 적용한 PIM 연산장치 간 통신 개념도(이미지=KAIST)
연구팀은 무엇보다 AI 구동에 필수적인 병렬 컴퓨팅과 기계학습 분야에서 널리 활용되는 집합 통신(Collective communication) 패턴에 집중했다. 집합 통신은 결정성(determinism)이라는 특징이 있는데, 이를 이용하면 각 연산장치의 통신량과 데이터 이동 경로를 미리 파악할 수 있다. 이를 최대한 활용해 기존 네트워크에서 발생하는 성능저하 효과를 크게 낮출 수 있었다. 이 결과 기존 시스템 대비 어플리케이션 성능이 최대 11배까지 높아진 것으로 나타났다.
김동준 교수는 “데이터 이동(data movement)을 줄이는 것은 PIM을 포함한 모든 시스템 반도체에서 핵심적인 요소”라면서 “PIM 연산장치 간 데이터 이동으로 인해 성능 확장성이 제약될 수 있어 응용 분야가 제한적이었는데, PIM 인터커넥트가 이에 대한 해법이 될 수 있다”고 연구의 의의를 설명했다.
이번 연구결과는 미국 네바다주 라스베이거스에서 열리는 컴퓨터 구조 분야 최우수 국제 학술대회인 ‘2025 IEEE International Symposium on High Performance Computer Architecture, HPCA 2025’에서 올 3월에 발표될 예정이다. 연구 제1 저자는 KAIST 전기및전자공학부 손효준 연구원(박사과정)이 맡았다. 한국연구재단, 삼성전자, 정보통신기획평가원 차세대지능형반도체기술개발사업의 지원을 받았다.
전승민 기자 enhanced@irobotnews.com
<저작권자 © 로봇신문사 무단전재 및 재배포금지>