MIT 컴퓨터과학인공지능연구소(CSAIL) 연구진이 도요타연구소와 아마존의 지원을 받아 로봇 훈련용 3D 가상 환경을 대량 생성할 수 있는 AI 시스템을 개발했다.
10일 MIT에 따르면, 연구팀이 개발한 ‘조종 가능한 장면 생성(steerable scene generation)’ 시스템은 주방, 거실, 식당 등 일상 공간의 3D 디지털 장면을 일반 언어 프롬프트만으로도 자동 생성한다. 이 기술은 로봇이 현실 세계에서 물건을 다루고 배치하는 방법을 학습하는 데 필요한 다양한 훈련 데이터로 활용될 수 있다.
이 시스템은 테이블, 접시 등 각종 객체(오브젝트) 모델이 배치된 4400만 개 이상의 3D 공간 데이터를 학습했다고 연구팀은 밝혔다.

▲조종 가능한 장면 생성(steerable scene generation) 시스템은 엔지니어들이 실제 로봇의 상호작용과 시나리오를 시뮬레이션하기 위해 사용할 수 있는 부엌, 거실, 레스토랑 등의 디지털 장면을 생성한다.(자료=MIT)
핵심은 바둑 AI 프로그램 알파고에서 사용된 ‘몬테카를로 트리 탐색(MCTS)’ 기법이다. MCTS는 다양한 부분 장면을 탐색하고 특정 목표에 따라 지속적으로 개선하는 방식으로 작동한다. 실제 테스트에서 이 시스템은 평균 17개 객체로 구성된 장면에서 훈련받았음에도 최대 34개 항목을 배치하는 등 훈련 데이터보다 더 복잡한 장면을 생성하는 능력을 보였다고 MIT는 밝혔다.
이 시스템이 생성하는 환경은 물리적으로 일관성이 있어 로봇 훈련에 실제 활용이 가능하다. 연구진은 가상 로봇이 생성된 환경에서 포크와 나이프를 수저통에 넣거나 빵을 접시에 올려놓는 등의 작업을 수행하는 모습을 기록했다. 이러한 시뮬레이션은 하드웨어 손상 위험 없이 반복 가능한 훈련 데이터를 제공한다.
연구팀은 이 연구가 개념증명(PoC)에 가깝다고 평가하면서, 향후 고정된 자산 라이브러리 대신 생성형 AI를 사용해 완전히 새로운 물체와 장면을 만들어내는 것을 목표로 한다고 밝혔다. 또 실제 이미지를 시뮬레이션 자산으로 변환하는 방안도 계획하고 있다.
이정환 기자 robotstory@irobotnews.com
저작권자 © 로봇신문 무단전재 및 재배포 금지
'부품·디바이스·소프트웨어' 카테고리의 다른 글
| 인텔, 차세대 ‘팬서 레이크’ 프로세서로 로봇 시장 공략한다 (0) | 2025.10.13 |
|---|---|
| 테솔로 DG-5F, 한양대 연구팀의 로봇 손 ‘문워크’ 영상으로 IEEE Spectrum에 등장 (0) | 2025.10.13 |
| 보스턴 다이나믹스, 신형 ‘그리퍼’ 공개…로봇 손 기술의 새로운 진화 (0) | 2025.10.13 |
| 로크웰 오토메이션, 차세대 컨트롤러 ‘컨트롤 로직스 5590’ 출시 (0) | 2025.10.10 |
| 뉴로메카, ‘자체 하모닉감속기 적용 100% 내재화 스마트액추에이터’ 탑재 협동로봇 공급 개시 (0) | 2025.10.02 |