ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 물리 기반 시뮬레이션과 AI의 결합
    Humanoid 2025. 4. 10. 09:01
    728x90
    SMALL

    로봇 학습을 위해 물리 시뮬레이션 AI 기법(특히 강화학습)을 결합하는 것은 필수적인 전략입니다. NVIDIA Cosmos는 이러한 전통적인 시뮬레이션 기반 학습을 한층 강화하는 역할을 합니다. 먼저, 강화학습(RL)에서는 가상환경에서 로봇이 수많은 시행착오를 겪으며 정책을 최적화하는데, Cosmos의 세계 모델과 NVIDIA의 시뮬레이션 툴이 함께 활용됩니다.

    예를 들어 NVIDIAIsaac Lab Isaac Sim 물리환경 위에서 동작하는 로봇 학습 프레임워크로서, 다관절 로봇의 조작이나 자율주행 로봇의 경로 계획 같은 작업을 가상으로 훈련시킵니다blogs.nvidia.com.

    개발자는 수천, 수만 회의 에피소드를 시뮬레이터에서 돌리면서 RL 알고리즘으로 로봇 제어 정책을 학습시키고, 그 정책을 현실에 이전(deployment)합니다. 이 과정에서 Cosmos생성형 AI로서 기여하는 바는 크게 두 가지입니다.

    첫째, Cosmos WFM이 만들어낸 다양한 가상 시나리오를 활용하여, 강화학습의 훈련 분포를 넓히고 다양하게 만들 수 있습니다. 예를 들어 단순한 시뮬레이션만으로는 접하기 힘든 극단적 상황(미끄러운 바닥, 복잡한 장애물 배치 등) WFM합성 데이터로 제공하면, RL 에이전트는 보다 폭넓은 경험을 쌓아 강인한 정책을 학습하게 됩니다.

    둘째, Cosmos 세계 모델을 모델 기반 강화학습에 활용할 수 있습니다. 로봇이 환경 모델(Cosmos WFM)을 통해 다음 상태를 예측하면서 계획하거나, 실시간으로 시뮬레이터 대신 학습된 세계 모델을 사용해 다수의 가상 rollout을 해볼 수 있습니다. 이는 일종의 신경망 시뮬레이터를 사용하는 것으로, 복잡한 물리 엔진을 매 step 마다 구동하지 않고도 정책 평가를 병렬로 수행하게 해줍니다. 이렇게 하면 특히 멀티버스방식의 계획(하나의 상황에서 여러 가능성을 시도)에서 속도 향상을 기대할 수 있습니다.

    요약하면, Cosmos물리 기반 시뮬레이션이 제공하는 정확한 환경에 생성형 AI의 유연성을 더해, 강화학습을 더욱 효과적으로 만드는 도구로 활용됩니다.

     

    Sim-to-Real(시뮬레이션-현실 전이) 측면에서도 Cosmos는 중요한 역할을 합니다. 시뮬레이터로 훈련한 로봇 정책을 실제 로봇에 이식할 때, 현실과 가상 환경 간의 차이가 문제가 되곤 합니다. Cosmos의 세계 모델은 현실 데이터로부터 학습되었기 때문에, 시뮬레이션 결과에 현실적인 노이즈와 복잡성을 부여하여 도메인 차이를 줄여주는 데 활용될 수 있습니다.

    예를 들어 Agility Robotics CTO “Cosmos의 텍스트, 이미지, 비디오--월드 생성 능력으로 포토리얼한 시나리오를 다양하게 만들어낼 수 있고, 이를 통해 값비싼 현실 데이터 수집에 대한 의존도를 낮추면서 로봇 학습을 진행할 수 있다고 언급했습니다[nvidianews.nvidia.com]. 이는 Cosmos가 생성한 물리적으로 사실적인 합성 데이터가 현실에서 수집한 데이터의 공백을 메워주고, 결과적으로 시뮬레이터에서 학습한 모델을 현실 환경에서도 잘 작동하도록 돕는다는 의미입니다.

    또한 자율주행 차 분야에서 Waabi같은 기업은 Cosmos를 데이터 큐레이션과 시뮬레이션에 활용함으로써, 현실과 동일한 수준의 사실성을 지닌 가상 시나리오를 만들어내고자 합니다[blogs.nvidia.com]. 이러한 generative 시뮬레이션은 시뮬레이터가 제공하는 정확한 센서 모델과 결합되어 Sim-to-Real 을 크게 좁혀줍니다. 다시 말해, Cosmos WFM이 만들어낸 영상은 실제 카메라로 촬영한 것처럼 정밀하고 물리적으로 합당하기 때문에, 로봇의 인식 모델이나 정책 모델이 가상훈련과 현실적용 간에 일관성을 유지할 가능성이 높아집니다.

    Cosmos활용하는 물리 엔진과 가상 환경에 대해 살펴보면, NVIDIAOmniverse 플랫폼과 밀접히 연동되어 있다는 점을 들 수 있습니다. Omniverse 기반의 시뮬레이터(Isaac Sim ) NVIDIA PhysX 5 물리 엔진을 사용해 GPU 가속 물리 시뮬레이션을 수행하고, 실시간 레이 트레이싱을 통한 포토리얼 렌더링을 제공합니다. Cosmos는 이러한 물리 시뮬레이터에서 생성된 고품질 3D 환경 데이터를 토대로 세계 모델을 학습하거나, 반대로 자신의 생성 결과물을 시뮬레이터와 결합하여 더욱 현실감 있는 장면을 얻어낼 수 있습니다.

     

    예를 들어 개발자가 Omniverse에서 가상의 창고 장면을 구성해 두면, Cosmos WFM이 그 장면을 조건으로 삼아 역학적으로 자연스러운 영상 시퀀스를 생성해낼 수 있습니다[blogs.nvidia.com].

    이는 전통적인 물리 엔진 시뮬레이션 결과에 생성형 AI의 풍부한 디테일을 입히는 전략이라 할 수 있습니다. 반대로, Cosmos가 생성한 시나리오를 물리 엔진으로 검증하거나 센서 시뮬레이션을 해봄으로써, 생성 데이터의 물리적 타당성을 확인하는 것도 가능합니다. 이러한 가상 데이터 생성 전략을 통해, Cosmos는 물리 엔진 기반 시뮬레이션의 정확성과 자신의 학습된 세계 지식을 모두 활용하여 방대한 훈련 데이터를 만들어냅니다. 특히 창고나 공장 같은 산업 환경이나 도로 주행 환경 등, 많은 변수를 지닌 현실 공간의 데이터를 Cosmos가 풍부하게 생성해낼 수 있으며, 이를 통해 로봇이나 차량의 인공지능을 더욱 견고하게 훈련시킬 수 있습니다.

     

     

    728x90
Designed by Tistory.