인공지능

UC 버클리, 강화학습으로 '젠가 채찍질' 동작 성공

로봇신문사 2025. 2. 10. 16:08

 

▲ 로봇이 젠가 채찍질, 달걀 후라이 뒤집기, 자동차 대시보드 조립, 타이밍 벨트 조립 등에 도전하고 있다.

 

UC 버클리 연구팀이 로봇에게 젠가 채찍질, 마더보드 조립, 이케아 가구 조립, 자동차 대시보드 조립 등 복잡한 작업을 빠르고 정확하게 학습시킬 수 있는 인공지능 기술을 개발했다고 밝혔다.

 

UC 버클리 ‘로보틱 AI 앤 러닝랩(RAILㆍRobotic AI and Learning Lab)' 연구팀은 이번에 39개의 나무 블록으로 쌓아올린 ‘젠가(Jenga)’ 타워를 쓰러뜨리지 않고, 채찍을 이용해 특정한 나무 블록만 빼내는 동작을 학습시켰다. 채찍을 이용해 이 같은 동작을 실행하는 것은 난이도가 매우 높다. 그동안 남다른 손재주와 반사 신경을 갖고 있다고 자부하는 많은 사람들이 ‘젠가 채찍질(Jenga Whip)’ 챌린지에 도전했다.

 

연구팀은 인공지능 훈련 방법을 활용해 로봇이 젠가 채찍질을 마스터하는 데 성공했다고 밝혔다. 로봇은 사람의 시연과 피드백, 그리고 실제 실행을 통해 학습함으로써 젠가 채찍질과 같은 복잡한 작업을 100%의 성공률로 수행하는 방법을 가르쳤다. 로봇은 1~2시간 이내에 컴퓨터 마더보드를 완벽하게 조립하고 선반을 만드는 방법도 학습했다.

 

연구팀에 따르면, 로봇학습 분야는 특정 장소에서 물체를 반복적으로 집어 드는 것과 같은 단일 작업이 아니라, 예측할 수 없는 복잡한 작업을 가르치는 방법에 대해 도전해 왔다.

 

RAIL 연구팀은 ‘강화 학습’에 집중했다. 강화학습으로 로봇이 현실 세계에서 복잡한 과제를 시도하고, 카메라의 피드백을 이용해 실수를 줄여가면서 결국은 복잡한 기술을 익힐 수 있다는 설명이다. 강화학습이라는 AI 방법을 사용해 로봇은 모든 시도(성공, 실패, 사람의 지원, 사람의 지원 없음)의 합계를 분석해 더 나은 작업을 수행할 수 있도록 지원한다. 로봇이 경험으로부터 학습함에 따라 사람의 개입은 점점 줄어든다.

 

연구팀은 젠가 채찍질 외에도 여러 복잡한 작업에 도전했다. 후라이판에서 달걀 후라이 뒤집기, 마더보드 조립, 자동차 대시보드 및 타이밍 벨트 조립, 이케아 가구 조립 등 작업을 성공적으로 학습시켰다.

 

장길수 ksjang@irobotnews.com

<저작권자 © 로봇신문사 무단전재 및 재배포금지>