인공지능/기술

中 엑스스퀘어로봇, 2000시간 규모 로봇 학습 데이터 공개

로봇신문사 2026. 6. 15. 09:56

▲사람이 VR헤드셋과 그리퍼를 착용하고 로봇 없이 물체 조작 시연을 수행하고 있다.

중국 로봇 스타트업 엑스스퀘어로봇(X Square Robot,自变量机器人科技)이 휴머노이드 로봇 학습을 위한 대규모 데이터 수집 프레임워크와 데이터셋을 오픈소스로 공개했다.

더로봇리포트 보도에 따르면, 엑스스퀘어 로봇은 최근 출판전 논문 공유 사이트인 '아카이브(arXiv)'에 실물 로봇 없이 인간 시연으로 데이터를 수집할 수 있는 프레임워크인 'XR 제로(XRZero)-G0’를 발표했다.(논문 제목:XRZero-G0: PushingtheFrontierofDexterous Robotic Manipulation withInterfaces,Quality and Ratio)

'XR제로-G0’는 인간 시연 데이터를 활용해 로봇 학습용 데이터를 수집하고 검증하는 하드웨어·소프트웨어 통합 프레임워크다. 회사는 이와 함께 2000시간 규모의 멀티모달 데이터셋인 ‘G0-데이터셋’도 공개했다. 이 데이터셋은 시각, 촉각, 음향 정보를 포함하며 약 3000개의 조작(manipulation) 작업 데이터를 담고 있다.

현재 휴머노이드 로봇 개발 기업들은 실제 로봇을 원격 조종(teleoperation)하며 학습 데이터를 수집한다. 하지만 로봇 한 대로 하루에 확보할 수 있는 데이터가 제한적이고 비용도 많이 들어 대규모 데이터 확보가 어려웠다. 업계에서는 이 문제가 피지컬 AI와 범용 로봇 개발의 핵심 병목으로 지적돼 왔다.

▲ XR제로-G0 아키텍쳐

XR제로-G0는 이러한 문제를 해결하기 위해 로봇 없이도 인간의 행동 데이터를 수집할 수 있도록 설계됐다. 사용자는 VR 헤드셋과 특수 그리퍼를 착용한 상태에서 작업을 수행한다. 시스템은 머리 부위 카메라와 양손 손목 카메라를 동시에 활용해 작업 환경과 손의 움직임을 다중 시점으로 기록한다. 이렇게 수집된 데이터는 실제 로봇이 인식하는 시각 정보와 최대한 유사한 형태로 변환된다.

회사는 데이터 수집부터 검증, 정책 학습, 실제 로봇 평가까지 이어지는 폐쇄형(closed-loop) 파이프라인을 구축했다고 밝혔다.

연구팀은 데이터 혼합 비율에 대한 실험도 수행했다. 그 결과 인간 시연 기반 데이터 10개와 실제 로봇 데이터 1개를 결합한 경우, 실제 로봇 데이터만으로 학습한 모델과 유사한 성능을 달성했다. 이를 통해 실제 로봇 데이터 수집량을 최대 20분의 1 수준으로 줄일 수 있다고 주장했다.

G0-데이터셋은 2000시간 이상의 시연 데이터가 포함돼 있으며, 기본적인 물체 집기부터 복잡한 의미 기반 조작 작업까지 다양한 작업이 담겨 있다.

연구팀은 XR제로-G0로 학습한 정책이 로봇의 위치나 테이블 높이, 카메라 시점이 달라져도 안정적으로 동작했으며, 학습 과정에 사용되지 않은 새로운 로봇 플랫폼에도 별도의 추가 학습 없이 적용되는 ‘제로샷(Zero-shot) 전이’ 능력을 보였다고 설명했다.

한편 최근 휴머노이드 업계는 로봇 하드웨어 경쟁에서 데이터 경쟁으로 무게중심이 이동하고 있다. 엔비디아, 구글 딥마인드, 피규어AI, 애질리티 로보틱스 등 주요 기업들도 대규모 데이터 확보에 집중하고 있다. 엑스스퀘어 로보틱스는 XR제로-G0와 같은 오픈소스 프로젝트가 로봇용 피지컬 AI 생태계 확대를 가속화할 것으로 기대하고 있다.

 

저작권자 © 로봇신문 무단전재 및 재배포 금지