로봇부품·소프트웨어

페이스북, 로봇이 보고 듣도록 훈련하는 3가지 기술 발표

로봇신문사 2020. 8. 31. 10:15
 
 
▲ 페이스북(FACEBOOK) 인공지능(AI) 연구소 페어(FARE)가 로봇이 시각뿐 아니라 청각도 사용해 과제를 수행할 수 있도록 훈련시키는 3가지 기술을 발표했다.(사진=MIT테크놀로지리뷰)

페이스북(FACEBOOK) 인공지능(AI) 연구팀은 로봇이 시각뿐 아니라 청각도 활용해 과제를 수행할 수 있는 3가지 기술을 개발했다고 ‘MIT 테크놀로지 리뷰’가 보도했다.

 

페이스북의 AI 연구실 페어(FARE)는 지난해 6월 AI 에이전트 양성을 목표로 시뮬레이션 플랫폼 AI 해비타트를 출시한 바 있다. 이 플팻폼을 통해 에이전트는 가구가 비치된 아파트나 큐비클이 가득 찬 사무실 등 다양하고 현실적인 가상 환경을 탐험한다. 이 에이전트를 탑재한 로봇은 현실 세계에서 충돌하지 않고 이동할 수 있게 된다.

 

페어는 지난해부터 '임바디드 AI(embodied AI, 체화된 인공지능)' 연구의 지평을 빠르게 확장해 3가지 이정표를 달성하게 됐다. 에이전트가 이동하는 공간을 빠르게 매핑하고 기억할 수 있게 해주는 알고리즘 두개, 에이전트가 듣는 훈련을 하도록 해비타트에 소리를 넣는 사운드 툴이 그것이다.

 

두 알고리즘은 지난 1월 페어가 수행한 연구를 바탕으로 제작됐다. 당시 에이전트는 지도 없이 낯선 환경을 탐색하도록 해비타트에서 훈련을 받았다. 훈련을 통해 심도 카메라, GPS, 나침반 데이터 등 3가지 기능만을 활용해 잘못된 길로 들어서거나, 역추적(backtracking)하거나 탐사하지 않아도 목적지에 도달하는 최단 경로를 찾을 수 있었다.

 

이번에 개발한 알고리즘 중 하나는 공간 지도를 동시에 구축할 수 있다. 이는 에이전트가 환경을 기억해 돌아올 때 보다 빠른 탐색을 가능하게 해준다.

 

두 번째 알고리즘은 공간의 모든 부분으로 이동할 필요 없이 매핑하도록 에이전트의 능력을 향상시킨다. 에이전트는 가상환경을 통해 충분한 훈련을 받은 후 새로운 환경에 있는 어떤 특징을 예측할 수 있다. 예를 들어 다른 곳을 탐색하지 않고도 아일랜드 주방 뒤에 비어있는 바닥 공간이 있다는 것을 추론할 수 있다. 결국 에이전트는 이 같은 기능 덕분에 새로운 환경이라도 빠르게 통과할 수 있게 된다.

 

연구팀은 해비타트에 매우 사실적인 음향 효과를 넣을 수 있는 ‘사운드 스페이시스(SoundSpaces)’라는 사운드 렌더링 툴도 개발했다. 이 툴은 다른 가구끼리 부딪칠 때 발생하는 소리, 바닥에 닿는 구두 굽 소리와 운동화 소리 등을 낼 수 있다. 해비타트는 이런 기능을 사용해 “내 전화기를 가져와” 또는 “사람이 노크하고 있는 문을 열어” 등 시각적, 청각적 센싱을 모두 요구하는 과제를 에이전트가 수행하도록 훈련시킨다.

 

연구팀은 이번에 개발한 3가지 기술을 통해 민첩하게 움직이고 요리와 같은 정교한 작업을 수행하는 보조 로봇을 만드는 데 기여할 수 있을 것으로 예상하고 있다. 이들은 향후 해비타트에 물건을 조작하는 상호작용 능력도 추가할 계획이다.