인공지능

[GTC 2025] 엔비디아, 개방형 휴머노이드 로봇 파운데이션 모델 '엔비디아 아이작 GR00T N1'공개

로봇신문사 2025. 3. 19. 16:03

 

 

 

▲ GR00T N1 파운데이션 모델은 휴머노이드 로봇에 일반화된 추론과 기술을 제공한다.(사진=엔비디아)

 

엔비디아가 18일(현지시간) 미국 새너제이에서 열린 ‘GTC 2025’에서 개방형 휴머노이드 로봇 파운데이션 모델인 '엔비디아 아이작 GR00T N1(NVIDIA Isaac GR00T N10)'을 공식 발표했다. 엔비디아 아이작 GR00T N1은 일반화된 휴머노이드 추론과 기술을 위한 세계 최초의 완전 맞춤형 개방형 파운데이션 모델이라고 소개했다.

 

또한, 엔비디아는 구글 딥마인드, 디즈니 리서치와 로봇 개발을 위해 특별히 설계된 오픈소스 물리 엔진인 '뉴튼(Newton)'도 개발하고 있다고 밝혔다.

 

젠슨 황(Jensen Huang) 창립자 겸 CEO는 이날 기조 강연에서 “일반적인 작업을 수행하는 로봇 기술의 시대가 도래했다. 엔비디아 아이작 GR00T N1과 새로운 데이터 생성, 로봇 학습 프레임워크를 통해 전 세계 로봇 개발자들은 AI 시대의 새로운 지평을 열게 될 것”이라고 말했다.

 

다음은 엔비디아가 이번에 발표한 내용에 관한 공식 설명 자료다.

 

◇휴머노이드 개발자 커뮤니티를 발전시키는 GR00T N1

 

GR00T N1 파운데이션 모델은 인간 인지 원리에서 착안한 이중 시스템 아키텍처를 특징으로 한다. ‘시스템 1’은 인간의 반사 신경이나 직관을 반영한 신속한 사고 행동 모델이며, ‘시스템 2’는 신중하고 체계적인 의사결정을 위한 느린 사고 모델이다.

 

비전 언어 모델을 기반으로 하는 시스템 2는 주변 환경과 수신된 지시에 대해 추론하고 행동을 계획한다. 그런 다음 시스템1은 이러한 계획을 정확하고 지속적인 로봇 움직임으로 변환시킨다. 시스템 1은 인간의 데모 데이터와 엔비디아 ‘옴니버스’ 플랫폼에서 생성된 방대한 양의 합성 데이터로 훈련된다.

 

GR00T N1은 물체를 잡거나, 한쪽 또는 양쪽 팔로 물체를 이동시키거나, 한 팔에서 다른 팔로 물건을 옮기는 등의 일상 작업을 쉽게 일반화할 수 있다. 또한, 긴 맥락과 일반적인 기술의 조합이 필요한 다단계 작업도 수행할 수 있다. 이러한 기능은 자재 취급, 포장, 검사 등 여러 상황에 널리 활용될 수 있다. 개발자와 연구자들은 특정 휴머노이드 로봇과 작업에 맞춰 실제 또는 합성 데이터를 사용해 GR00T N1을 사후 훈련시킬 수 있다.

 

젠슨 황 CEO는 GTC 기조연설에서 1X 테크놀로지스(1X Technologies)의 휴머노이드 로봇이 GR00T N1을 기반으로 사후 훈련된 알고리즘을 사용해 자율적으로 집안 일을 정리하는 모습을 시연했다. 이 로봇의 자율 기능은 1X와 엔비디아의 AI 훈련 협업을 통해 개발됐다.

 

1X 테크놀로지스 CEO인 베른트 뵈르니히(Bernt Børnich)는 “휴머노이드의 미래는 적응력과 학습에 관한 것이다. 엔비디아의 GR00T N1 모델은 로봇의 추론과 기술 개발을 위한 획기적인 돌파구를 제공한다. 이 모델을 통해 우리는 최소한의 사후 훈련 데이터만으로도 네오 감마(NEO Gamma) 로봇을 실제 환경에서 사용 가능하도록 완벽하게 준비시킬 수 있다. 이제 로봇을 단순히 도구가 아니라 의미 있고 수많은 방식으로 인간을 돕는 동반자로 만든다는 우리의 사명을 더욱 발전시킬 수 있다”라고 말했다.

 

엔비디아는 GR00T N1을 미리 이용할 수 있는 세계적인 주요 휴머노이드 개발사로 애질리티 로보틱스(Agility Robotics), 보스턴 다이나믹스(Boston Dynamics), 멘티 로보틱스(Mentee Robotics), 뉴라 로보틱스(NEURA Robotics) 등을 꼽았다.

 

◇구글 딥마인드, 디즈니 리서치와 함께 물리 엔진에 주목

 

엔비디아는 구글 딥마인드, 디즈니 리서치와 협력해 로봇이 복잡한 작업을 정밀하게 처리하는 방법을 학습할 수 있도록 하는 새로운 오픈소스 물리 엔진인 뉴튼(Newton)을 개발한다고 발표했다.

 

엔비디아 워프(Warp) 프레임워크를 기반으로 구축된 뉴턴은 로봇 학습에 최적화돼 있으며, 구글 딥마인드의 무조코(MuJoCo), 엔비디아 아이작 랩(Lab)과 같은 시뮬레이션 프레임워크와도 호환된다. 이 세 기업은 뉴튼이 디즈니의 물리 엔진을 활용할 수 있도록 지원할 계획이다.

 

구글 딥마인드와 엔비디아는 로보틱스 머신 러닝 작업을 70배 이상 가속화할 것으로 기대되는 ‘무조코-Warp’를 개발하기 위해 협력하고 있다. 개발자들은 구글 딥마인드의 MJX 오픈소스 라이브러리와 뉴튼을 통해 이를 이용할 수 있다.

 

디즈니 리서치는 차세대 엔터테인먼트 로봇을 구동하는 플랫폼을 발전시키는 데 뉴튼을 가장 먼저 사용할 계획이다. 여기에는 젠슨 황 CEO가 GTC 기조연설 무대에서 선보인 ‘스타워즈’에서 영감을 받은 'BDX 드로이드(droids)'가 포함된다.

 

월트 디즈니 이미지니어링 R&D(Walt Disney Imagineering Research & Development) 수석 부사장인 카일 라플린(Kyle Laughlin)은 “BDX 드로이드는 시작에 불과하다. 우리는 예전에 볼 수 없던 방식으로 더 많은 로봇 캐릭터를 생동감 있게 만드는 데 최선을 다하고 있으며, 디즈니 리서치, 엔비디아, 구글 딥마인드와의 협업은 이러한 비전의 핵심적인 부분이다. 이번 협업을 통해 그 어느 때보다 표현력이 풍부하고 매력적인 차세대 로봇 캐릭터를 제작하며, 디즈니만의 독창적인 방법으로 고객과 소통할 수 있게 될 것”이라고 말했다.

 

엔비디아와 디즈니 리서치는 인트린직(Intrinsic)과 함께 로봇 데이터 워크플로우를 위한 오픈USD(OpenUSD) 파이프라인과 모범 사례를 구축하기 위한 추가 협력을 발표했다.

 

◇로봇 사후 훈련 개발을 위해 더 많은 데이터 생성

 

로봇 개발에는 대규모의 다양한 고품질 데이터 세트가 필수적이지만, 이를 수집하는 데는 높은 비용이 든다. 휴머노이드 로봇 훈련에 필요한 데이터에 비해, 실제 사람이 시연해 보일 수 있는 데이터는 24시간이라는 시간적 제약으로 인해 한계가 있다.

 

새로 발표된 합성 조작 모션 생성을 위해 엔비디아가 개발한 '아이작 GR00T 블루프린트'는 이러한 문제를 해결한다. 이 블루프린트는 옴니버스와 엔비디아 코스모스 트랜스퍼(NVIDIA Cosmos Transfer)라는 월드 기반 모델을 기반으로 구축됐다. 개발자가 소수의 인간 시연을 통해 얻은 데이터를 바탕으로 다양한 조작 작업을 수행하는 데 필요한 합성 모션 데이터를 기하급수적으로 많이 생성할 수 있도록 지원한다.

 

엔비디아는 이 블루프린트의 초기 구성요소를 사용해 사람이 6500시간, 즉 9개월 동안 시연할 수 있는 데이터에 해당하는 78만 개의 합성 경로를 단 11시간 만에 생성했다. 그런 다음 이 합성 데이터를 실제 데이터와 결합해 실제 데이터만 사용한 경우보다 GR00T N1의 성능을 40% 향상시킬 수 있다.

 

개발자 커뮤니티에 유용한 훈련 데이터를 제공하기 위해 엔비디아는 GR00T N1 데이터 세트를 대규모 오픈소스 물리 AI 데이터 세트의 일부로 출시한다. 이 데이터 세트는 현재 허깅 페이스(Hugging Face)에서 사용할 수 있다.

장길수 ksjang@irobotnews.com

<저작권자 © 로봇신문사 무단전재 및 재배포금지>