로봇/휴머노이드로봇

“휴머노이드 로봇 훈련 위한 '긱 이코노미' 전 세계 확산일로”

로봇신문사 2026. 4. 13. 14:09

▲휴머노이드 로봇 훈련 데이터 수집을 위해 '긱이코노미'가 뜨고 있다. (사진=제미나이로 생성한 이미지)

나이지리아·인도 등 개발도상국 청년들이 머리에 스마트폰을 쓰고 집안일을 촬영해 판매하는 신종 데이터 수집 산업이 전 세계로 확산하고 있다고 MIT테크놀로지 리뷰가 1일(현지시간) 보도했다.

보도에 따르면 휴머노이드 로봇이 공장에서 일하고 집에서 가사 도우미 역할을 하려면, 로봇 훈련을 위한 방대한 실세계 데이터가 필요하다. 이에 따라 휴머노이드 로봇 기업들이 로봇 훈련에 필요한 실생활 동작 데이터를 확보하기 위해 개발도상국 청년들을 적극 활용하면서 ‘긱 이코노미(gig economy)’ 시장이 뜨고 있다는 분석이다.

긱 이코노미는 정규직이 아닌 단기·건별 계약 형태로 일하는 노동 시장을 의미한다. 이런 일은 현지 기준으로 급여 수준이 높고 지역 경제 활성화에도 기여하고 있다. 하지만 개인정보 보호와 충분한 정보에 바탕을 둔 '동의' 절차가 요구된다. 데이터 수집 활동 작업 자체가 고되고 생소하다는 점도 과제로 꼽힌다.

MIT 테크놀로지 리뷰는 ‘가정에서 휴머노이드 로봇을 훈련시키는 긱 노동자(The gig workers who are training humanoid robots at home)’라는 제하의 기사에서 휴머노이드 로봇 훈련 데이터를 수집하는 저개발국 청년들의 노동 실태와 문제점을 분석했다.

미국 팔로알토 소재 데이터 수집 기업 마이크로1(Micro1)은 인도, 나이지리아, 아르헨티나 등 50개국 이상에서 수천 명의 계약직 근로자를 고용하고 있다. 이들은 머리에 스마트폰을 쓰고 세탁물 정리, 설거지, 요리 등의 집안일을 직접 촬영해 제출한다.

알리 안사리(Ali Ansari) 마이크로1 CEO는 로봇 기업들이 현재 자사를 비롯한 데이터 기업들로부터 실세계 데이터를 구매하는 데 연간 1억달러 이상을 지출하고 있다고 밝혔다. 그는 "수요가 매우 많고 증가 속도도 빠르다"고 말했다.

이 같은 수요는 휴머노이드 로봇의 특성에서 비롯된다. 가상 시뮬레이션 방식은 로봇이 곡예 동작을 학습하는 데는 활용할 수 있지만, 물체를 잡고 이동하는 방법을 가르치기는 어렵다. 시뮬레이션이 물리 법칙을 완벽하게 모델링하는 데 한계가 있기 때문이다. 공장과 가정에서 실제로 작동하는 로봇을 만들려면 시간과 비용이 많이 들더라도 실세계 데이터가 필요하다는 것.

휴머노이드 로봇 분야 투자도 빠르게 증가하고 있다. 2025년 한 해 동안 휴머노이드 로봇 분야에 쏟아진 투자금만 60억달러를 넘었다.

스케일 AI(Scale AI), 엔코드(Encord) 등 데이터 기업들은 자체적으로 데이터 수집 인력을 모집하고 있으며, 도어대시(DoorDash)는 배달 기사들에게 자신들이 하고 있는 일을 영상으로 촬영하는 비용을 지불하고 있다. 중국은 수십 개의 국영 로봇 훈련 센터에서 노동자들이 가상현실(VR) 헤드셋과 외골격 장비를 착용하고 로봇에게 직접 동작을 가르치고 있다.

마이크로1 근로자들은 '자라(Zara)'라는 AI 에이전트가 진행하는 인터뷰와 샘플 영상 심사를 통해 채용된다. 이후 손이 화면에 잘 보이도록 하고 자연스러운 속도로 움직이는 등 세부 지침에 따라 집안일 영상을 촬영해 매주 제출한다. 제출된 영상은 AI와 수백 명의 인력이 검토·승인하고, '레이블링(주석 작업)' 작업이 이뤄진다.

로봇 훈련에 대한 이 같은 접근은 현재 초기 단계다. 따라서 어떤 것이 양질의 훈련 데이터인지는 아직은 명확하지 않다. 알리 안사리 마이크로1 CEO는 "로봇이 기본적인 이동과 물체 조작을 이해하고 일반화하려면 매우 다양한 변형 데이터가 제공되어야 한다"고 말했다.

나이지리아에서 의대에 다니는 '제우스(Zeus)'는 시간당 15달러의 임금을 받지만, 좁은 원룸에서 매일 몇 시간씩 옷을 다리는 단순 반복 작업을 하는게 지루하다고 털어놨다.

제우스는 지난해 11월 링크드인과 유튜브 곳곳에서 데이터 수집에 관한 일자리 정보를 알게 됐다. "미래에 로봇을 훈련시키는 데 쓰일 데이터를 제공하며 한 획을 그을 수 있는 정말 좋은 기회가 될 것 같았다"고 당시를 회고했다. 하지만 그는 "솔직히 이 일을 그다지 좋아하지 않는다. 나는 기술적인 일을 원한다"고 말했다.

인도 델리에서 과외 교사로 일하는 '아르준(Arjun)'은 15분짜리 영상 하나를 만들기 위해 새로운 집안일을 구상하는 데만 한 시간이 걸린다고 말했다. 두 딸의 아버지인 아르준은 촬영 화면에 불쑥 들어오는 두 살배기 딸을 화면 밖으로 내보내느라 진땀을 빼고 있다며 "딸이 아직 너무 어려서 가끔은 업무를 수행하기가 정말 힘들다"고 토로했다.

제우스를 비롯해 MIT 테크놀로지 리뷰와 인터뷰한 근로자들은 자신의 업무에 관해 발언할 권한이 없다는 이유로 가명으로만 언급해 달라고 요청했다.

이같은 데이터 수집방식은 개인정보 침해 우려도 제기된다. 마이크로1은 근로자들에게 얼굴과 이름, 전화번호 등 개인정보가 화면에 노출되지 않도록 요구하지만, 영상에는 집 내부 구조와 소지품, 일상 루틴 등 사생활이 고스란히 담길 수밖에 없다. 근로자들은 자신의 데이터가 어떻게 저장되고 제3자와 공유되는지를 정확히 알지 못한다고 밝혔다. 영상 검토 과정에서 얼굴이나 이름같은 명백한 식별 정보 외의 민감한 정보들은 제대로 걸러지지 않을 가능성이 있다는 것이다.

야스민 코투리(Yasmine Kotturi) 메릴랜드대 볼티모어 카운티(UMBC) 교수는 “노동자들이 이러한 작업에 참여할 경우, 기업이 직접 그들에게 작업의 의도를 명확히 알리는 것이 중요하다. 이 기술이 장차 어느 단계까지 발전할 수 있는지, 그리고 장기적으로 노동자에게 어떤 영향을 미치게 될지에 대해 반드시 고지해야 한다"고 강조했다.

ASTM 인터내셔널의 로봇공학자인 에런 프래더(Aaron Prather)는 “우리가 집에서 생활하는 방식이 안전 관점에서 항상 올바른 것은 아니다”라며, “만약 이 노동자들이 사고를 유발할 수 있는 나쁜 습관을 로봇에게 가르치고 있다면, 그것은 결코 양질의 데이터라고 할 수 없다”고 비판했다.

기술적 한계에 대한 전문가의 신중한 시각도 있다. 켄 골드버그 UC버클리 교수는 "대규모언어모델(LLM)은 인간이 10만 년을 읽어야 할 분량의 텍스트와 이미지로 훈련됐다. 휴머노이드 로봇은 로봇 관절 제어가 텍스트 생성보다 훨씬 복잡하기 때문에 그보다 더 많은 데이터가 필요할 수 있다"며 "사람들이 생각하는 것보다 훨씬 오래 걸릴 것"이라고 말했다.

백승일 기자 robot3@irobotnews.com

저작권자 © 로봇신문 무단전재 및 재배포 금지