AI
-
1.3. 최신 강화학습 기법과 Sim-to-Real 적용Humanoid 2025. 3. 19. 09:13
위에서 설명한 패러다임을 구현하기 위해 다양한 강화학습 기법들이 최근 도입되고 있습니다. 앞서 (c)에서 언급한 바와 같이 모델 프리/모델 기반 RL, 모방 학습, 계층형 RL 등이 그것입니다. 구체적으로 몇 가지 대표 기법들을 정리하면 다음과 같습니다:1) 모델 프리 강화학습환경 모델 없이 정책 또는 행동가치 함수를 직접 학습합니다. 정책 경사 방법(예: TRPO, PPO)이나 Q러닝 계열(예: DQN, SAC)이 여기에 속합니다. 로봇 제어에서는 연속 제어에 강한 DDPG, TD3, SAC, PPO 등이 주로 사용되어 왔습니다. 이 방식은 이론적으로 최적 정책을 찾을 수 있지만, 샘플 효율이 낮아 수많은 시도가 필요하므로 현실 로봇에는 바로 적용하기 어려워 시뮬레이터를 활용하는 경우가 많습니다. Ca..
-
1.3. 규제와 법적 이슈: 각국의 자율주행 허가 동향자율주행 2025. 3. 18. 10:19
자율주행은 기술적 발전만으로 해결되지 않습니다. 사고 책임은 누구에게 있는지(제조사? 소프트웨어 개발사? 운전자?), 보험 체계는 어떻게 바뀌는지, 도로교통법은 어떻게 개정해야 하는지 등 다양한 법·제도적 합의가 필수적입니다. 또한 각국의 규제 속도와 기준이 달라, 자율주행 기업들은 시험 주행이나 상용화를 추진할 때 매번 해당 지역의 법·제도 요구 사항을 충족해야 합니다. 1) 미국주(州) 단위 규제• 캘리포니아, 애리조나, 텍사스 등 주마다 자율주행 시험 허가 절차가 상이합니다.• 예를 들어 캘리포니아 DMV는 자율주행차 업체에 “디센게이지(disengagement) 보고서” 제출을 요구해, 운전자 개입 상황을 투명하게 공개하도록 하고 있습니다.[4]• 웨이모(Waymo), 크루즈(Cruise) 등 업..
-
3.18 Agent, Humanoid, 자율주행 관련 주요 뉴스news 2025. 3. 18. 10:12
# Today's AI Agent, humanoid, fsd, autonomous driving Major News### 1. AI agent as your digital chief of staffURL: https://indianexpress.com/audio/our-own-devices/ai-agent-as-your-digital-chief-of-staff/9878947/Content: 뉴스 기사 번역: 에피소드 213AI 에이전트, 당신의 디지털 비서인디언 익스프레스의 기술 팟캐스트 'Our Own Devices'의 새로운 시즌에 오신 것을 환영합니다. 이 에피소드에서는 인디언 익스프레스 온라인의 최고운영책임자(COO)인 Nandagopal Rajan이 Mohak Shroff, 시니어 부사장과 함께..
-
3.17 AI Agent 주요 뉴스news 2025. 3. 17. 09:47
# 오늘의 AI Agent 주요 뉴스### 1. China's Manus AI 'agent' could be our 1st glimpse at artificial general intelligenceURL: https://www.livescience.com/technology/artificial-intelligence/chinas-manus-ai-agent-could-be-our-1st-glimpse-at-artificial-general-intelligence내용: 뉴스 기사 번역:마누스 소개: 일반 AI 에이전트 - YouTube 시청중국 과학자들이 인간 조작자로부터 특정 지시를 필요로하지 않고 자체적으로 결정을 내리는 인공 지능(AI) "에이전트"를 공개했다.AI 에이전트, 마누스는...### 2...
-
1.4-5 LangGraph를 활용한 에이전트 예시에이전트 2025. 3. 16. 13:36
좀 더 구체적으로 LangGraph의 개념을 이해하기 위해, 실 세계 시나리오를 하나 살펴보겠습니다. 다시 고객 지원 챗봇 예시로 돌아가 보죠. 이번에는 사용자의 질문에 따라 다르게 대응하는 지능형 챗봇을 LangGraph로 설계한다고 상상해봅시다. LangGraph를 활용하면 이 챗봇의 동작 흐름을 다음과 같이 구성할 수 있습니다:질문 분류 노드: 사용자의 질문을 분석해 어떤 유형의 요청인지 파악합니다 (예: 기술 지원, 계정 문의, 일반 질문 등).정보 검색 노드: 질문 유형에 맞춰 내부 지식 베이스나 데이터베이스에서 관련 정보를 찾아옵니다. 예를 들어 계정 관련 문의라면 사용자 계정 정보를 조회하고, 기술 지원 문의라면 FAQ나 매뉴얼을 검색합니다.응답 생성 노드: 찾은 정보를 바탕으로 사용자에게 ..
-
3.16 자율주행 주요 뉴스news 2025. 3. 16. 12:40
# 오늘의 autonomous driving 주요 뉴스### 1. Travis Kalanick thinks Uber screwed up: "Wish we had an autonomous ride-sharing product"URL: https://techcrunch.com/2025/03/12/travis-kalanick-thinks-uber-screwed-up-wish-we-had-an-autonomous-ride-sharing-product/내용: 간략히Uber의 전 CEO인 트래비스 칼라닉은 수요일에 분명히 했다: 회사가 자율 주행 프로그램을 포기한 결정은 실수였다고 믿고 있다. 칼라닉은 LA에서 열린 풍요 정상회의에서 말했다. "보시다시피, [새 경영진]이 그것을 망치고 말았다."### 2. Big..
-
3.16 AI Agent 주요 뉴스news 2025. 3. 16. 12:33
# 오늘의 AI Agent 주요 뉴스### 1. China's Manus AI 'agent' could be our 1st glimpse at artificial general intelligenceURL: https://www.livescience.com/technology/artificial-intelligence/chinas-manus-ai-agent-could-be-our-1st-glimpse-at-artificial-general-intelligence내용: 뉴스 기사 번역:마너스 소개: 일반 인공 지능 에이전트 - YouTube에서 시청중국 과학자들이 인간 조작자로부터 구체적인 지시를 필요로하지 않고 자체 결정을 내리는 인공 지능(AI) "에이전트"를 공개했습니다.AI 에이전트, 마너스,는....
-
1.2 강화학습과 로봇 학습 패러다임 (Reinforcement Learning and Robot Learning Paradigms)Humanoid 2025. 3. 15. 09:24
로봇에게 자율성을 부여하는 핵심 기술로 강화학습(RL) 이 부상하면서, 로봇 학습 연구는 몇 가지 축으로 분류하여 이해할 수 있습니다. 로봇 학습을 바라보는 네 가지 측면은 (a) 로봇이 학습해야 하는 핵심 역량은 무엇인지, (b) 그 문제를 정의(추상화)하는 방식, (c) 문제를 푸는 해결 접근법, 그리고 (d) 얻은 해법의 실제 환경 성공 수준입니다[arxiv.org].이 섹션에서는 이 네 가지 측면을 중심으로 현대 로봇 강화학습 패러다임을 설명하고, 실제 사례인 Tesla Optimus, Agility Robotics, Figure AI의 학습 방식을 비교하며, 최신 RL 기법들과 sim-to-real 등 현실 적용 이슈를 논의합니다.(a) 로봇이 학습해야 하는 핵심 역량 (Robot Compet..