일론 머스크는 테슬라의 사업 방향을 자동차 제조에서 휴머노이드 로봇 개척으로 대담하게 전환하고 있다. 이 로봇 사업의 정점에는 옵티머스 로봇(Optimus Robots)이 있지만, 현재 이 로봇은 여전히 다소 어설프고 부자연스러운 움직임을 보인다. 옵티머스를 영원히 '서툰 고철 덩어리'로 두지 않기 위해 테슬라는 거대한 노력을 비밀리에 투입하고 있다.
캘리포니아 팔로 알토에 위치한 테슬라 엔지니어링 본부의 비밀 연구소에서는 수십 명의 직원들로 구성된 '데이터 수집 운영자'들이 매일 수백 번씩 상상 가능한 거의 모든 평범한 인간의 동작을 녹화하는 고된 작업을 수행하고 있다.
인공지능(AI) 산업이 막대한 양의 에너지와 데이터센터로 구동되는 동시에, 기술이 완벽해 보이도록 뒤에서 일하는 수많은 '인간 노동력'에 의존하는 것과 같은 맥락이다. 기존의 '데이터 주석 작업자(data annotators)'가 텍스트나 이미지에 라벨을 붙인다면, 옵티머스 랩의 '데이터 수집 운영자'들은 그들 자신이 곧 데이터 세트가 된다.
인간 동작을 기록하는 고강도 노동
이 직원들은 다섯 대의 카메라가 장착된 헬멧과 최대 18kg(약 40파운드)에 달하는 무거운 백팩을 착용한다. 컵 들기부터 테이블 닦기, 청소기 돌리기, 컨베이어 벨트 위의 차량 부품 정리까지 일상적인 모든 행동을 기록한다. 비즈니스 인사이더(Business Insider)에 따르면, 심지어 "치킨 댄스"나 엉덩이춤(twerking)처럼 다소 의아한 요구 사항도 수행했다.
한 전직 데이터 수집 운영자는 비즈니스 인사이더와의 인터뷰에서 "현미경 아래의 실험용 쥐와 같다"고 묘사했다. 이 작업은 매우 고통스러우며, 같은 동작을 엄청나게 반복해야 한다. 직원들은 때로 몇 주 동안 테이블 닦기와 같은 하나의 동작만 반복하도록 배정된다. 8시간 근무 시간 동안 최소 4시간 분량의 활용 가능한 영상을 만들어내야 하며, 그들의 움직임이 "인간답지 않다"고 판단되면 불이익을 받을 수 있다. 다른 전직 직원은 "한 걸음 걷고, 테이블을 닦고, 재설정 자세로 돌아가서, 모든 것을 다시 반복한다"며 "쉬는 시간까지 헹구고 반복하는 것"과 같았다고 회고했다.
로봇 사업의 비전과 현실의 괴리
머스크는 옵티머스를 통해 테슬라의 가치 대부분이 창출될 것이라고 예측하며, 장기적으로 연간 100만 대 생산 목표를 제시했다. 테슬라는 올해 말까지 5,000대의 옵티머스 로봇을 확보하겠다는 내부 목표를 설정했을 정도로 야심 차다. 가정용 작업이 가능한 휴머노이드 로봇 시장은 언젠가 수조 달러 규모에 달할 것으로 예상된다.
그러나 최근 옵티머스 시연은 이러한 야심 찬 비전과 거리가 멀었다. 지난 9월 세일즈포스 CEO 마크 베니오프가 옵티머스에게 콜라를 요청하는 시연 영상에서, 로봇은 심각하게 지연된 반응을 보였고, 말 중간에 끊기거나 얼어붙는 등 둔하고 부자연스러운 움직임을 보였다.
테슬라가 이처럼 방대하고 중복되어 보이는 동작 데이터 수집에 집중하는 이유는, 과거 AI 산업이 엄청난 양의 훈련 데이터로 생성형 모델에서 돌파구를 마련했듯이, 로봇 분야에서도 유사한 AI 학습 혁신을 기대하기 때문으로 풀이된다.
하지만 데이터 수집 운영자들이 "아기에게 가르치는 것"처럼 단순하거나, 심지어 고릴라처럼 행동하거나 도발적으로 춤추는 등의 기괴한 AI 생성 요청을 수행해야 했다는 사실은, 이 훈련 과정이 아직 갈 길이 멀다는 점을 시사한다. 특히 투자자들에게 옵티머스를 시연할 때는 모션 캡처를 이용한 인간의 원격 조작에 의존했다는 전직 직원들의 증언은, 현재 옵티머스의 자율 능력이 과대 포장되었을 수 있다는 의혹을 키운다.
