인물연구

'젊은 로봇 공학자' (46) KAIST 황보제민 교수

로봇신문사 2021. 7. 1. 11:55

'젊은 로봇 공학자(Young Robot Engineer)' 코너는 한국로봇학회와 로봇신문이 공동으로 기획한 시리즈물로 미래 한국 로봇산업을 이끌어 갈 젊은 로봇 공학자를 발굴해 소개하는데 있다.

46번째 인터뷰는 KAIST 황보제민 교수다. 황보 교수는 1988년 서울에서 태어났지만 중학교 때 온 가족이 캐나다로 이민을 가서 고등학교를 벤쿠버 근처 랭리(Langley)라는 도시에서 다녔다. 캐나다 토론토대학 기계공학과를 졸업하고 2013년 4월 스위스 ETH 쥬리히 대학원에서 로보틱스, 시스템 및 제어 석사, 2019년 2월 기계공학으로 박사 학위를 받았다. 박사 졸업 후 2020년 2월까지 1년간 ETH 쥬리히 로보틱 시스템 랩에서 박사후 연구원으로 재직하다 귀국, 2020년 3월부터 KAIST에서 조교수로 근무하고 있다.

주요 관심 분야는 심층신경망을 이용한 강화학습, 강체 시뮬레이션이다. 2013년 최우수 석사논문상(기계공학), 최우수졸업상(로보틱스, 시스템 및 제어), 2019년 ETH 메달(우수 박사논문상)등을 수상했다.

▲KAIST 황보제민 교수가 인터뷰에 앞서 사진 촬영을 하고 있다. 조규남 전문기자

Q. 로봇인공지능연구소(RAI)에 대한 간단한 소개 부탁 드립니다.

Rai Lab은 2020년도 설립된 카이스트 기계공학과 소속 로봇 연구실입니다. 아직 규모는 작지만, 보행 로봇의 설계와 강화학습을 이용한 제어 연구를 활발하게 하고 있습니다. 보행 로봇 분야에서 저희 목표는 동물보다 민첩하고 빠르게 이동할 수 있는 로봇을 만드는 것입니다. 이는 로봇 설계, 제어, 인지, 경로계획 분야에서 모두 획기적인 성과가 있어야만 실현이 가능한 목표입니다. 저희는 강화학습 등 다양한 기계학습 기법을 이용해 이러한 로봇 문제들을 풀어가고 있습니다. 또한, 로봇 설계와 물리엔진 분야도 꾸준히 연구하고 있습니다. 로봇 시스템에 대한 전반적인 이해도가 뒷받침되어야 좋은 로봇을 만들 수 있다고 믿기 때문에 많은 분야에서 연구를 진행하고 있습니다.

Q. 최근 하고 계신 연구가 있다면 소개 부탁드립니다.

현재는 삼성미래육성센터에서 지원받아 보행 로봇의 제작, 제어, 경로계획을 연구하는 프로젝트를 진행하는 중입니다. 제 박사 연구의 연장으로 기계학습을 이용한 제어가 중심인 프로젝트입니다. 25kg 정도 되는 사족 보행 로봇 설계를 완성한 상태이고 조립하는 중입니다. 큰 문제가 없다면 올해 안에 완성되어 달릴 수 있을 겁니다. 이 새로운 로봇으로 다양한 제어 연구도 진행할 예정입니다. 로봇이 계단을 뛰어 올라가거나 징검다리를 달려 건너는 등 다양하고 역동적인 모션제어를 하는 것이 프로젝트 목표입니다. 또한, MIT에 계신 김상배 교수님이 기부해 주신 미니 치타(Mini Cheetah) 로봇으로 제어 연구를 진행하는 중입니다. 미니 치타는 무게가 작아 사고의 위험도 적고 좀 더 적극적으로 실험할 수 있다는 게 장점인 것 같습니다.

Q. 스위스 ETH 쥬리히(Zurich)에서 박사 학위를 받으셨는데 제목과 어떤 내용인지 소개 부탁 드립니다.

제 박사 논문 제목은 “Simulation to Real World: Learn to Control Legged Robots”입니다. ETH 쥬리히에서는 이전에 냈던 논문들을 모아 박사 논문으로 제출할 수 있는 큐멀레이티브 디시스(Cumulative thesis) 제도가 있습니다. 제 논문도 Cumulative thesis입니다. 박사과정 때 하던 연구는 다양합니다. 처음에는 로봇 설계 쪽을 많이 연구했습니다. 애니멀(ANYmal)의 구동부인 시드라이브(SEA drive) 디자인에 참여했고 케이블 펄리(Cable-Pulley)로 작동하는 케이플러(Capler) 로봇을 디자인하기도 했습니다. 그 후 옆 연구실의 사인규 박사님과 강화학습을 이용한 드론제어 연구도 잠시 진행하였습니다. 그 후에는 물리엔진 개발을 위해 접촉동역학 연구를 진행하였고 이를 프로그래밍하여 연구에 사용할 수 있는 라이심의 초기 버전을 만들기도 하였습니다. 그 후에는 라이심을 이용한 강화학습으로 ANYmal 로봇을 걷고 뛰고 넘어졌을 때 일어날 수 있는 제어 연구를 진행하였습니다.

Q. 심층신경망(DNN)을 이용한 강화학습을 통해 로봇을 제어하는 분야에 관심이 많다고 들었습니다. 강화학습을 이용해 로봇을 제어하면 무엇이 좋은지, 기존의 모델기반 제어 방법과는 어떤 차이가 있는지 궁금합니다.

강화학습을 이용하면 기존의 방법으로 제어하기 힘든 어려운 문제를 풀 수 있다는 장점이 있습니다. 주로 시스템의 모델을 모를 때 효과적인데 비디오 게임이 좋은 예입니다. 대부분의 비디오 게임들이 수학적으로 모델 되기 힘듭니다. 또한, 기존 제어방법에서는 모델에서 그래디언트(gradient:경사도)나 야코비안(Jacobian:함수행렬식) 등을 구해야 하는데 비디오 게임에서는 그런 값들을 구하기는 어렵습니다.

보행 로봇은 일반적으로는 모델이 가능한 시스템입니다. 조인트로 연결된 시스템의 동역학을 구하는 방법은 수백년간 연구됐습니다. 하지만 외부 환경과 접촉 등 다양하고 불확실한 상황을 모델하는 것은 쉽지 않습니다. 또한, 카메라 센서 등에서 얻어지는 정보를 통해 시스템을 모델하는 것은 더욱더 어렵습니다.

반면 강화학습은 모델을 필요로 하지 않습니다. Jacobian, graident, Hessian(헤시안:헤시안행렬) 등의 값들이 필요하지 않기 때문에 모델을 알 필요도 없고 따라서 시스템에 특화되지도 않습니다. 이는 정보를 적게 쓴다는 점에서는 단점으로 보일 수도 있겠지만 이러한 정보를 얻는 것이 어려운 시스템에서는 단점이 되지 않습니다. 시스템에 특화되는 제어방법이 아니므로 다양한 시스템에 손쉽게 적용된다는 장점도 있습니다. 이미지 등의 어려운 센서 정보도 이용할 수 있습니다.

저와 많은 연구자는 학습 방법 없이는 보행 로봇과 같은 복잡한 시스템을 제어하기란 불가능할 것이라고 믿고 있습니다. 물론 기존 모델기반 제어방법들도 응용되어서 함께 쓰일 수 있다는 연구는 여러 그룹에서 진행 중인 것으로 알고 있습니다.

Q. 험난한 지형에서 보행 로봇을 제어하는 방법은 아직 많은 연구가 이루어지지 않은 분야로 알고 있습니다. 이 연구에서 가장 큰 애로 기술은 무엇인지 궁금합니다.

말씀 하신 대로 험난한 지형에 보행 로봇이 자유롭게 움직이는 것은 아직도 어렵습니다. 이에는 여러 문제가 얽혀 있습니다. 가장 큰 문제는 지형의 불확실성입니다. 빠르게 움직이는 상황에서는 로봇이 모든 지형의 정보를 정확하게 예측하기는 쉽지 않습니다. 또한, 시간이 많이 주어진다고 하더라도 지형의 동역학적 정보를 정확히 알려주는 센서는 존재하지 않습니다. 불확실한 상황에 대처하는 방법은 두 가지가 있습니다. 첫 번째는 최대한 안전하게 제어하는 방법입니다. 이는 제어의 성능에 영향을 줄 수 있습니다. 두 번째는 로봇이 얻는 다양한 정보를 이용해서 예측 에러를 최대한 줄이는 방법입니다. 이는 더 좋은 성능을 낼 수 있지만 다양한 정보를 모두 효율적으로 이용하여 불확실한 환경을 예측하기는 쉽지 않습니다.

지형을 정확히 아는 상황에서도 험난한 지형에서 제어가 쉬운 것은 아닙니다. 우선 복잡한 지형에서 경로계획을 세워야 하고 그 경로계획에 따라 제어할 수 있어야 합니다. 이는 사람과 동물에게도 어려운 일입니다. 예를 들면 사람은 직접 뛰어보기 전에 자신이 얼마나 멀리 뛸 수 있는지 예측하기 어렵습니다. 평평한 지형의 경우 경험으로 예측할 수는 있지만, 높이가 다르거나 기울기가 있는 경우에는 판단하기가 힘들어집니다. 로봇도 이를 정확히 예측하는 건 불가능하지만 최대한 정확한 예측을 해야 하며 실패했을 경우 사람처럼 효율적으로 복구할 수 있는 능력이 필요합니다.

강화학습이 이런 복잡한 경우에도 효율적이라 생각하기 쉽지만 보행 로봇에 특화된 네트워크 구조나 학습 방법이 없다면 쉽지 않은 문제입니다. 네트워크는 마법이 아닙니다. 제어 네트워크도 위에서 말씀드린 복잡한 계산 프로세스를 해야 하며 기본적인 네트워크 구조만으로는 이런 일을 하기 어렵습니다.

Q. 강체 시뮬레이션(Rigid-body simulation)도 연구분야 중 하나인데 강체 시뮬레이션에서 물리엔진(Physics engine)이 왜 로봇에 대한 가장 중요한 툴이라고 보시나요?

물리엔진은 로봇 분야에서 크게 두 가지 역할을 합니다. 첫 번째는 제어와 인식 알고리즘들이 잘 작동하는지를 실제 로봇에 돌려보기 전에 테스트해주는 역할입니다. 보통 실제 로봇이 비싸고 위험할 수 있으므로 로봇의 움직임에 영향을 주는 알고리즘들은 시뮬레이션에서 검증한 후 실제 로봇에서 돌리는 것이 좋습니다.

다른 역할은 최근에 주목받은 강화학습입니다. 시뮬레이션으로 빠르게 강화학습 알고리즘이 잘 작동하는지를 테스트 해볼 수 있고 또 시뮬레이션에서 학습된 제어기를 실제 로봇에 옮겨보는 심투리얼(SimToReal) 방법에 적용할 수도 있습니다. 레이심(RaiSim)을 이용하는 연구자들은 대부분 강화학습을 위해 사용 중인 것으로 알고 있습니다.

물리엔진이 가장 중요한지는 모르겠지만 가장 중요한 소프트웨어 툴 중 하나는 맞는 거 같습니다.

Q. 이외에도 로봇 제어에 대한 최신 동향이나 특이점이 있다면 무엇이 있을까요?

최근의 로봇 제어는 대부분 강화학습 같은 학습기반 제어방법이 주도하고 있습니다. IROS나 ICRA같은 학회를 가보면 강화학습에 관련된 페이퍼가 매우 많습니다. 로봇 전체로 봤을 때도 딥러닝(Deep Learning)을 사용한 페이퍼가 1/3이 정도 되는 것으로 알고 있습니다.

보행 로봇 분야에서는 보스톤 다이나믹스(Boston Dynamics), 유니트리(Unitree), 고스트 로보틱스(Ghost Robotics), 애질러티 로보틱스(Agility Robotics)같은 회사들의 선전도 눈에 띕니다. 이제 보행 로봇이 연구중심 토픽에서 실용적 기술로 바뀌고 있다는 신호인 거 같습니다. 돈이 집중되는 만큼 발전 속도도 빠를 것이라 믿고 있습니다.

Q. 로봇을 연구하시게 된 동기가 있다면?

거창한 이유는 없습니다. 대학교 때부터 역동적으로 움직이는 로봇들에 매료되었고 그냥 재밌을 것 같아 로봇 연구를 시작하였습니다.

Q. 스위스에서 9년여 연구를 하셨는데 스위스는 로봇 분야에서도 어느 분야가 강점이라고 생각하시는지, 또 우리가 배울만한 점은 무엇이 있을까요?

스위스의 가장 큰 강점은 연구비 같습니다. 인구당 투자하는 연구비가 세계 최고 수준으로 알고 있습니다. 물론 한국도 굉장히 높은 편입니다. 하지만 스위스의 연구비는 스타트업 같은 기본연구비 비중이 높습니다. 제안서를 쓰면서 보내는 시간도 적고 정량적 평가를 고민할 필요도 없습니다. 제안서를 써서 돈을 받아도 제안서 내용과 다른 연구를 해도 됩니다. 좋은 연구를 성실하게만 진행한다면 제약이 별로 없습니다.

연구비 외에도 각 교수의 자율성을 인정해주는 정책들이 스위스의 강점인 것 같습니다. 지나친 규제와 규칙들로 행정 절차만 복잡해지고 연구에 집중할 수 있는 시간이 줄어듭니다. 신뢰가 바탕이 되어야 이루어질 방법인데 한국에서도 충분히 가능하리라 생각합니다.

▲ 지난 5월 21일 강원도 휘닉스 호텔 포레스트 홀에서 열린 제16회 한국로봇종합학술대회(KRoC 2021) 신진연구자 세션에서 황보제민 카이스트 교수가 보행로봇 제어 연구에 대해 발표하고 있다.

Q. 2019년 3월부터 2020년 2월까지 올해 2월까지 스위스 ETH 쥬리히에서 약 1년간 박사후 연구원으로 계셨는데 어떤 연구를 주로 하셨는지요?

박사후연구원 기간은 소프트웨어 개발에 시간을 많이 썼습니다. 예전에 C++기반 학습 코드들을 파이썬으로 바꾸고 시뮬레이터 개발에도 시간을 많이 썼습니다. 또한, 보행 로봇이 험지에서 움직일 수 있게 만드는 연구도 병행하였습니다. 제가 나올 당시에는 계단을 걷고 박스를 올라갈 수 있을 정도로 진행이 됐었는데 현재 ETH 쥬리히 후배들이 연구를 이어받아 진행하고 있습니다.

Q. 로봇 연구자로서 앞으로의 꿈과 목표가 있다면?

연구만 하고 끝내는 연구자보다는 실제 사용 가능한 로봇을 만드는 연구자가 되고 싶습니다. 한 부분에 집중하기보다는 전체적인 시스템의 성능을 높이는 로봇 공학자가 되고 싶습니다. 연구 결과가 왜 중요한지 설명해야 하는 연구보다는 누가 봐도 중요하고 필요해 보이는 연구를 하고 싶습니다.

Q. 최근 로봇에 대한 관심이 늘어나면서 이를 연구하려는 학생이 늘어나고 있습니다. 선배로서 후배에게 어떤 준비와 노력이 필요한지 조언해 주신다면?

지름길은 없습니다. 기본이 되는 수학, 물리 과목부터 차근차근 공부해야 합니다. 프로그래밍도 일찍 시작할수록 좋습니다. 남들보다 시간을 더 많이 투자하고 열정을 갖고 공부해야 됩니다. 작은 프로젝트부터 해보면 좋습니다. 딥러닝이 모든 문제를 풀어주진 않습니다. 클래시컬한 방법들을 공부하고 딥러닝을 공부해야 어떻게 응용할 수 있는지 알 수 있습니다.

▲ 지난 6월 23일 여수 소노캄에서 열린 '2021 제36회 제어로봇시스템학술대회(ICROS)'에서 한국과학기술원 황보제민 교수가 제어로봇시스템학회 이두용 회장(사진 왼쪽)으로 부터 우수신진연구자상을 받고 있다.

Q. 연구자로서 한국 로봇산업이 한 단계 더 발전하기 위해 조언을 해 주신다면...

제가 아직 경험도 부족하고 한국에 돌아온 지 얼마 안 돼 조언할 수 있는 위치는 아닙니다. 하지만 결국 인재들을 어떻게 데려올 수 있느냐가 관건인 것 같습니다. 인재들은 결국 자신의 연구를 최우선으로 생각합니다. 따라서 더 좋은 연구 환경을 만들어 주는 것이 중요합니다. 연구에만 집중할 수 있는 환경이 된다면 인재들은 곧 찾아올 것입니다. 물론 그런 환경을 유지해준다는 믿음 또한 필요합니다. 이는 시간이 해결해 즐겁습니다.

Q. 연구에 주로 영향을 받은 교수님이나 연구자가 계시다면...

가장 영향을 많이 받은 연구자는 저의 지도교수님이신 마코 허터(Marco Hutter) 교수님이십니다. 냉철하지만 정이 많고 자기 사람들을 잘 챙기십니다. 연구실에서 너무 다양한 분야의 연구가 이루어 지지만 기본적인 내용은 다 파악하고 계십니다. 이해력이 뛰어나서 가능한 것 같습니다. 박사 때부터 로봇 설계를 오래 하셔서 직접 디자인도 하시고 지도도 하십니다. 또한, 제가 본 최고의 매니저입니다. 한 명 한 명 사람들을 챙기며 함께 어울리십니다. 지성과 카리스마로 사람을 끌어당기는 능력이 있습니다. 그냥 몇 마디 말만 해봐도 느껴지는 연구자와 매니저의 아우라가 있습니다. 이런 능력은 아마 타고나야 되는 거 같습니다. 같이 일해본 사람 중 블래드렌 콜튼(Vladlen Koltun) 박사님도 비슷한 능력을 갖추고 계십니다.

조규남 전문기자 ceo@irobotnews.com

<저작권자 © 로봇신문사 무단전재 및 재배포금지>