본문 바로가기
Humanoid

Optimus vs. Cosmos 기반 로봇 개발 비교:데이터 수집 및 합성 데이터 활용

by aiagentx 2025. 4. 16.
반응형

1) 실환경 데이터 수집

Tesla Optimus 개발은 실제 환경에서의 방대한 데이터 축적 철학을 따릅니다. 예를 들어 Tesla는 자동차 자율주행 FSD 개발에서 수백만 마일에 달하는 실제 주행 데이터를 활용해왔고, Optimus에도 유사한 접근을 적용하고 있습니다. Optimus를 학습시키기 위해 인간 시연 데이터를 모으는 전담 팀을 운영하는데, 사람에게 모션 캡처 슈트와 VR 헤드셋을 착용시켜 다양한 작업 동작을 수행하게 함으로써 로봇 훈련용 데이터를 수집합니다[newo.ai]. 이러한 인간 시연 데이터는 인간 작업 동작의 궤적을 그대로 기록하여 로봇의 모방 학습에 활용됩니다. Tesla는 이를 통해Autopilot에 실제 주행 데이터를 모았듯이, Optimus에 인간이 대리 수행한 데이터를 모은다는 전략을 취하고 있습니다.

전문가들은 이렇게 일반적인 작업을 학습시키려면 수십만~수백만 시간 이상의 시연 데이터가 필요할 것으로 추산하며, Tesla도 실제 수십 명의 인력을 투입해 데이터 팜을 구축하는 등 대규모 데이터 수집에 나서고 있습니다.

 

2) 합성 데이터 생성 및 활용

 

반면 NVIDIA Cosmos 플랫폼은 합성 데이터 생성에 중점을 둔 접근법입니다. Cosmos월드 파운데이션 모델(WFM)이라 불리는 거대 생성 모델들의 모음으로, 현실 물리 세계의 영상을 생성·시뮬레이션하는 데 특화되어 있습니다. NVIDIA로봇과 자율주행 개발에 필요한 방대한 물리 세계 데이터를 대규모 생성 모델로 손쉽게 만들어낼 수 있다고 설명하며, Cosmos를 통해 포토리얼한 물리 기반 합성 데이터를 대량 생성할 수 있다고 강조했습니다[nvidianews.nvidia.com] .

Cosmos의 핵심은 이미 인간이 걷거나 물건을 다루는 실제 영상 2천만 시간분의 데이터로 학습된 거대 모델이라는 점입니다[wired.com]. , 현실 세계 영상으로부터 학습하여 물리적 일관성이 담보된 합성 시뮬레이션 데이터를 만들어내는 것입니다. 예를 들어 Cosmos는 창고에서 인간이 상자를 떨어뜨리는 상황 등의 영상을 현실감 있게 생성해 로봇이 이러한 사고 상황을 인식하고 대응하도록 훈련할 수 있습니다.

 

개발자는 Cosmos 모델을 자신의 로봇 데이터로 파인튜닝하거나, 필요에 따라 텍스트나 예시 영상으로 원하는 시나리오의 합성 영상을 만들어낼 수 있습니다

.

3) 비교

 요약하면, Tesla Optimus 쪽은 실제 데이터 우선 접근으로, 자동차 자율주행 센서 데이터인간 시연을 통해 현실 그대로의 데이터를 모으고 이를 보강하기 위해 자체 시뮬레이션도 일부 활용합니다. 실제 데이터의 정확도를 바탕으로 부족한 부분은 물리적으로 정확한 합성 데이터로 보완하는 전략입니다[anyverse.ai].

반면 NVIDIA Cosmos시뮬레이션 우선 접근으로, 현실 데이터를 학습한 생성 모델을 활용해 다양한 가상 시나리오 데이터를 저비용으로 대량 생산하는 것이 강점입니다. Cosmos를 사용하면 방대한 현실 데이터가 없어도 다양한 상황의 훈련 데이터를 민첩하게 합성할 수 있어, Tesla처럼 거대한 현실 데이터베이스가 없는 로봇 개발자도 데이터 부족과 편향 문제를 극복할 수 있습니다.

다만 Optimus는 수집된 현실 데이터의 정확성으로 초반부터 현실 환경 적합도를 높이는 반면, Cosmos다양한 가상 데이터를 통해 범용성을 높이는 방식이라고 볼 수 있습니다.

 

반응형