GIST, 사람과 협업 가능한 ‘AI 로봇 파지 모델’ 개발

▲ 광주과학기술원(GIST) 연구팀이 개발한 로봇손 파지 제어 기술 '그래스프샘(graspSAM)'의 동작 순서도.(이미지=GIST)
산업 현장에서 로봇이 물체를 정확하고 안정적으로 잡기 위해서는 정교한 파지(把持, grasp) 기술이 필수적이다. 이 과정에서 인공지능(AI) 학습이 필요한데, 기존 기술은 물체의 종류나 환경 변화에 따라 새로운 모델 학습이 필요하며, 제한된 데이터세트에 의존하는 한계가 있었다.
광주과학기술원(GIST) AI융합학과 이규빈 교수 연구팀은 단순한 자동화를 넘어, 작업자와의 협업을 고려한 세계 최고 성능의 혁신적인 로봇 파지 모델 ‘그래스프샘(GraspSAM)’을 개발했다고 밝혔다.
연구팀은 기존의 파지 모델들은 환경과 상황에 따라 별도의 AI모델을 학습해야 하는 한계를 지니고 있다는 점에 착안, 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있는 GraspSAM 모델을 설계했다. 기존 모델의 한계를 극복하고, 학습되지 않은 물체라도 복잡한 환경에서 안정적으로 파지할 수 있도록 만들었다.
연구팀은 이를 해결하기 위해 페이스북 모회사 메타(Meta)가 개발한 범용 이미지 분할 모델인 샘(SAM, Segment Anything Model)을 활용했다. 샘을 로봇 파지 분야에 적용한 것은 이번이 처음이다. 이렇게 askems GraspSAM은 SAM의 강력한 객체 분할 능력을 활용해 최소한의 미세 조정만으로 물체의 파지점을 예측할 수 있다. 세부적으로는 ‘어댑터(Adapter)’ 기법과 ‘학습 가능한 토큰(Learnable Tokens) 기법’을 적용해 SAM을 파지점 추론에 최적화했다. 두 가지 기법 모두 대형 AI 모델을 효율적으로 미세 조정(fine-tuning)하는 과정에서 많이 쓰인다.
GraspSAM은 프롬프트 기반 입력을 지원한다. 사용자가 제공하는 텍스트는 물론 점 등의 단순한 입력도 이해해 다양한 환경·물체·상황에 즉각적으로 적응할 수 있도록 설계됐다.
연구진은 이렇게 만든 GraspSAM을 실제 로봇에 도입한 결과, 보다 다양한 물체를 손쉽게 잡을 수 있으며, 단 한 번의 연산만으로 파지점을 예측해 산업 현장에서의 적용 범위를 획기적으로 확장할 수 있다는 사실을 실제 실험을 통해 확인했다. 로봇 손의 파지 성능을 확인할 수 있는 프로그램 ‘그래스프 애니띵(Grasp-anything)’과 ‘재카드(Jacquard)’를 통해 검증한 결과 최고 수준(SOTA, State of the Art)의 성능을 나타냈다.
또 복잡한 실제 환경에서도 로봇이 안정적으로 파지 작업을 수행할 수 있다는 것을 확인했다.
무엇보다 인간 작업자와 협업 성능이 크게 높아졌다. 산업현장에서 인간과 함께 일할 수 있는 이른바 ‘협동로봇’은 현재 사용자와 부딪혔을 때 자동으로 멈추는 안전기능 정도만 제공한다. GIST 연구진은 GraspSAM에 눈동자 추적 기술을 결합, 작업자의 시선에 맞춰 파지 작업을 수행하는 기능까지 성공적으로 구현했다.
이규빈 GIST 교수는 “GraspSAM 모델은 로봇과 사용자의 직관적인 상호작용이 가능하며, 복잡한 환경에서도 탁월한 파지 능력을 발휘한다”면서 “산업 현장뿐만 아니라 가정용 로봇, 서비스 로봇 등 다양한 분야에 폭넓게 활용될 것으로 기대한다”고 밝혔다.
연구팀은 이번 연구성과를 로봇 분야 세계 최고 권위 학회인 IEEE ICRA(International Conference on Robotics and Automation)에서 2025년 5월 발표할 예정이다. 노상준 GIST 박사과정생이 주도적으로 연구를 수행했다. 산업통상자원부와 과학기술정보통신부의 지원을 받았다.

▲ 광주과학기술원(GIST) 연구팀이 고성능 로봇 손 파지 기술을 개발했다. (왼쪽부터) AI융합학과 이규빈 교수, 노상준 박사과정생, 김종원·강래영·남동우 석박사통합과정(박사과정), 백승혁 한국기계연구원 선임연구원(사진=GIST)
전승민 기자 enhanced@irobotnews.com
<저작권자 © 로봇신문사 무단전재 및 재배포금지>