반응형 전체 글119 2.1시뮬레이션과 물리 기반 AI의 로봇 학습에서의 역할:Sim-to-Real 기법의 중요성과 도전 과제 시뮬레이션과 물리 기반 AI의 로봇 학습에서의 역할1. Sim-to-Real 기법의 중요성과 도전 과제Sim-to-Real(시뮬레이션에서 현실로)은 로봇이 가상 환경에서 학습한 모델이나 정책을 실제 물리적 로봇에 이식하는 기술을 말합니다. 이는 로봇 학습에서 중요한 역할을 하지만, 이식 과정에서 이른바 “현실 격차”(reality gap)라는 큰 도전이 존재합니다. 시뮬레이터는 현실 세계의 물리나 센서 특성을 완벽히 재현할 수 없기 때문에, 시뮬레이션에서 잘 동작하던 로봇 제어 정책이 실제 로봇에서는 예상과 다르게 실패할 수 있습니다[ar5iv.labs.arxiv.org]. 예를 들어 시뮬레이션에서는 마찰계수나 센서 잡음 등을 단순화하거나 이상적으로 가정하지만, 실제 환경에서는 변수가 훨씬 많고 .. 2025. 3. 21. 3.21 Agent, Humonoid, 자율주행 주요 뉴스 1. Oracle is giving your business the chance to create its own AI agentshttps://www.techradar.com/pro/oracle-is-giving-your-business-the-chance-to-create-its-own-ai-agents오라클, 회사들이 에이전트를 구축하거나 확장하는 데 도움을 주기 위해 AI 에이전트 스튜디오를 출시사용자들은 완전히 새로운 AI 에이전트를 구축하거나, 기존에 있는 50개 이상의 오라클 옵션 중 하나를 사용할 수 있습니다.또한 사용 가능한 LLM들 중에서 선택할 수 있습니다.오라클은 최근...2. Humanoid robot revolution is closer than you thinkhttps://ca.. 2025. 3. 21. 1.4. 자율주행 등급(Level 0~5)과 기술적 의미 자율주행 기술을 논할 때 가장 많이 언급되는 것이 SAE International(미 자동차공학회)이 정의한 운전 자동화 수준(SAE J3016 표준)입니다.[5]• Level 0: 전혀 자동화되지 않은 상태(일반 차량).• Level 1: 일부 운전 지원(예: 크루즈 컨트롤, 차선 유지 보조 등).• Level 2: 부분 자동화(운전자가 상시 관여, 테슬라 오토파일럿, 현대 HDA 등).• Level 3: 조건부 자동화(일부 구간에서는 시스템이 스스로 운전, 운전자는 필요 시 개입).• Level 4: 고도 자동화(지정된 구역·조건에서 시스템이 전부 수행, 운전자가 개입하지 않아도 됨).• Level 5: 완전 자동화(도로·환경에 구애받지 않고 차량이 전부 운전). 1) 테슬라(Tesla) 현황FSD(.. 2025. 3. 20. 3.20 Agent, Humanoid, 자율주행 주요 News 1. Humanoid robot revolution is closer than you thinkhttps://ca.finance.yahoo.com/news/nvidia-ceo-humanoid-robot-revolution-100134721.htmlStephen Nellis 작성산 호세, 캘리포니아 (로이터) - Nvidia의 CEO인 젠슨 황은 인간형 로봇이 5년 이내에 제조 시설에서 널리 사용될 것이라고 믿습니다.화요일에 황은 가득 찬 하키 경기장 앞에서 기조 연설을 했습니다...2. Humanoid robot revolution is closer than you thinkhttps://finance.yahoo.com/news/nvidia-ceo-humanoid-robot-revolution-10013.. 2025. 3. 20. 1.3. 최신 강화학습 기법과 Sim-to-Real 적용 위에서 설명한 패러다임을 구현하기 위해 다양한 강화학습 기법들이 최근 도입되고 있습니다. 앞서 (c)에서 언급한 바와 같이 모델 프리/모델 기반 RL, 모방 학습, 계층형 RL 등이 그것입니다. 구체적으로 몇 가지 대표 기법들을 정리하면 다음과 같습니다:1) 모델 프리 강화학습환경 모델 없이 정책 또는 행동가치 함수를 직접 학습합니다. 정책 경사 방법(예: TRPO, PPO)이나 Q러닝 계열(예: DQN, SAC)이 여기에 속합니다. 로봇 제어에서는 연속 제어에 강한 DDPG, TD3, SAC, PPO 등이 주로 사용되어 왔습니다. 이 방식은 이론적으로 최적 정책을 찾을 수 있지만, 샘플 효율이 낮아 수많은 시도가 필요하므로 현실 로봇에는 바로 적용하기 어려워 시뮬레이터를 활용하는 경우가 많습니다. Ca.. 2025. 3. 19. 3.18 AI Agent, Humanoid, 자율주행 관련 뉴스 # Today's AI Agent, humanoid, fsd, autonomous driving Major News### 1. Nvidia CEO hypes AI with new chips and ‘supercharged humanoid robots’URL: https://www.afr.com/technology/new-chips-and-supercharged-humanoid-robots-in-nvidia-chief-s-plan-20250319-p5lkopContent: 뉴스 기사 번역: Nvidia는 인공 지능 붐의 중심에 자리를 잡기 위해, 더 강력한 칩, 로봇공학 모델, 그리고 개발자들이 데스크톱 기계에서 작업할 수 있게 해줄 "개인 AI 슈퍼컴퓨터"에 대한 계획을 제시했습니다.공동... [308 .. 2025. 3. 19. 이전 1 ··· 14 15 16 17 18 19 20 다음 반응형