수백만 대 차량 플릿과 베타 테스트
• 테슬라는 이미 전기차 시장 선도기업으로서 방대한 차량 보급량을 자랑하며, 이들 차량이 주행하면서 생성하는 실도로 영상·센서 데이터를 수집해 클라우드로 전송합니다.[1][2]
• FSD Beta 프로그램은 이 데이터를 기반으로 OTA 업데이트를 계속 실시하며, 운전자들 역시 “실험적 기능”이란 경고를 받고서 사용하게 됩니다. 이때 발생하는 주행 로그는 다시 테슬라가 받아 네트워크를 개선하는 데 활용합니다.
자동 라벨링 & 섀도우 모드
• 대규모 데이터 라벨링에는 AI 기반 자동 라벨링 시스템이 사용되고, 사람은 검수·보정만 담당해 효율을 높입니다.
• 테슬라는 “섀도우 모드(Shadow Mode)” 방식으로, 새로운 모델을 실제 도로에서 운전자 모르게 병행 평가하고, 구형 모델과 결과를 비교해 안전성을 점검합니다.[9]
OTA(Over-The-Air) 업데이트의 효과
• 새로운 신경망 모델이 완성되면, OTA를 통해 차량에 배포되어 실도로에서 곧바로 “학습된 기능”을 시험합니다.
• 이 “데이터 → 학습 → 배포 → 다시 데이터 수집” 루프가 빠르게 돌아가며, 경쟁사 대비 소프트웨어 개선 주기가 짧다는 것이 테슬라의 큰 장점입니다.

테슬라가 추구하는 “데이터 엔진”은 자율주행을 완성하기 위한 핵심 기제로서, 실제 주행 데이터를 끊임없이 수집하고 이를 바탕으로 머신 러닝 알고리즘을 반복적으로 학습시켜, 더 높은 수준의 자율주행 신경망을 만들어내는 독창적인 방식이다. 테슬라 차량에는 두 개의 FSD(Full Self-Driving) 컴퓨터가 탑재되는데, 하나는 자동조종장치(Autopilot) 활성화 시 실제 차량을 제어하고, 다른 하나는 “그림자 모드(Shadow Mode)”로 작동하며 운전자의 예기치 못한 조작이나 신경망의 불확실성을 감지한다.

그림자 모드는 단순히 백업용으로 가만히 있는 것이 아니다. 마치 실제 도로를 운행하는 듯이 모든 상황을 시뮬레이션하고, 운전자가 예상과 다르게 조작하거나 신경망이 상황을 제대로 이해하지 못했다고 판단되면, 그 순간을 ‘부정확성’으로 기록한다. 이때 테슬라는 이런 부정확성이 발생한 특정 상황을 다른 차량에도 적용해 유사 주행 조건을 찾아내고, 결과적으로 폭넓은 실제 데이터 예제를 수집한다. 이렇게 엄선된 데이터는 더욱 꼼꼼하게 라벨링되어 신경망 재교육에 활용되고, 새로운 버전의 자율주행 신경망이 다시 그림자 모드로 배포되어 또 다른 부정확성을 포착하는 식으로 학습 고리가 이어진다.

이 반복적 데이터 수집과 학습 과정은 테슬라의 데이터베이스 인프라 및 무선(OTA) 업데이트 시스템을 통해 원활히 이뤄진다. 테슬라 자동차는 주행 도중 식별된 부정확성을 즉시 보고해 중앙 서버로 전송하며, 그 결과 대규모 머신 러닝 시험이 이뤄지는 데이터 센터에서는 이 실제 운전 상황을 신경망이 놓치지 않도록 빠르게 반영한다. 이후 새롭게 교육된 베타 버전의 알고리즘은 다시 그림자 모드로 차량에 배포되어, 전 세계를 달리는 테슬라의 방대한 차량 네트워크를 통해 또 다른 예외적 상황을 찾고 해결책을 모색한다. 이러한 “데이터 엔진”이 가진 최대 강점은, 실제 도로 위에서 벌어지는 무수한 사례를 머신 러닝에 직접 투입함으로써 극단적 상황까지 놓치지 않고 대응할 수 있다는 점이다.
가령 테슬라는 예전부터 ‘자전거 인식’을 중요한 과제로 삼아 왔는데, 자전거가 차량에 매달려 있거나 지붕 위에 올라간 이례적 상황에서 인간 운전자와 그림자 신경망의 반응을 면밀히 비교하며 ‘정확한 처리가 무엇인지’를 꾸준히 학습하고 있다. 이렇게 재교육된 신경망은 이후 새 버전 FSD에 반영되어 동일한 상황에서 훨씬 정확한 판단을 내릴 수 있게 된다. 또 한 가지 눈여겨볼 부분은, 데이터 엔진이 인간 운전자의 실수를 필터링한다는 사실이다. 테슬라는 시스템이 감지한 부정확성이 단순한 운전자 과실 때문은 아닌지, 신중히 검증 과정을 거친다. 만약 운전 미숙 탓이 아니라 실제로 신경망이 대응 방식을 몰라 생긴 문제로 판명되면, 그 즉시 해당 사례가 수집 대상이 되어 머신 러닝 재교육에 활용되는 식이다.

1) 오토 라벨링(Auto Labeling) 시스템

- 오토 라벨링이 필요한 이유
자율주행 시스템이 고도화될수록, 대규모 주행 영상과 센서 데이터가 필요해집니다. 그러나 이膨대한 데이터를 사람이 일일이 라벨링(객체 위치, 차선, 보행자 등)을 하기에는 시간과 인력이 너무 많이 듭니다.
• 인력·시간 절감: 방대한 영상 데이터를 빠르게 라벨링함으로써, 뉴럴 네트워크에 필요한 학습용 데이터를 효율적으로 생산합니다.
• 정밀도 제고: 라벨링 과정에서 사람의 실수나 주관적 편차를 줄이고, 일관성 있는 기준을 유지할 수 있습니다.
- 동작 방식
테슬라는 차량에서 수집된 주행 영상을 신경망 기반 알고리즘으로 사전 분석하여, 객체나 차선, 주변 환경 등에 대한 초기 라벨(자동 분류 결과)을 할당합니다. 그 뒤 필요에 따라 사람이 검수·수정하는 방식으로 자동 + 사람 검수의 혼합 라벨링 프로세스가 이뤄집니다.
• 그림자 모드(Shadow Mode) 활용: 주행 중 에러나 특이 사례가 포착되면, 추가 라벨링 대상으로 자동 등록하여 빠르게 문제 상황을 수집·분석합니다.
• 오류 수정 및 재학습: 오토 라벨링이 놓친 객체나 불완전한 분류가 발견되면, 이를 보완하는 과정을 반복해 점차 정확도를 높입니다.
- 활용 가치
• 코너 케이스(Corner Cases) 확보: 기존 알고리즘이 놓친 이례적 상황을 집중적으로 라벨링해 신경망 재교육에 투입함으로써, 자율주행 소프트웨어의 안정성을 강화합니다.
• 데이터 엔진(Data Engine) 가속화: 테슬라가 추구하는 빠른 반복 학습(데이터 수집 → 라벨링 → 모델 업데이트) 사이클의 핵심적인 엔진으로 작동합니다.
2) .smol 파일 포맷

- .smol 파일 포맷의 탄생 배경
테슬라 차량에서 생성되는 영상·센서 데이터의 양은 방대하며, 이를 OTA(Over The Air) 방식으로 전송하고 중앙 서버에서 통합·분석해야 합니다. 일반적인 영상·텍스트 형식만으로는 비효율이 크기 때문에, 테슬라 내부용으로 개발된 맞춤형(binary) 형식인 .smol 파일을 사용합니다.
- 주요 특징
고도의 압축(High Compression)
• 영상·라벨·3D Occupancy 같은 멀티모달 데이터를 하나로 묶되 용량을 최소화해, 네트워크 대역폭과 저장 공간을 효율적으로 활용합니다.
멀티 모달 통합 저장
• 각 프레임의 원본 영상, 오토 라벨링 결과(객체 ID·차선·바운딩 박스), 3D 볼륨 맵 등 다양한 정보를 단일 컨테이너에 담을 수 있습니다.
• 추후 분석 및 재학습 시 .smol 파일 하나만 있으면 상황 전체를 재현하기 쉽습니다.
버전 호환성 내장
• 빠르게 발전하는 테슬라 소프트웨어 스택에 대응하기 위해, .smol 파일에는 자체적인 버전 관리 정보를 포함합니다.
• 새로운 FSD 버전에서도 예전 .smol 파일을 불러올 수 있으며, 반대로 신버전 포맷을 구버전에서 인식할 수 있도록 부분 호환이 가능하도록 설계되는 것으로 알려져 있습니다.

- 오토 라벨링과의 연계
• 오토 라벨링 결과 포함: 오토 라벨링된 데이터(객체 종류, 위치, 차선 분할 등)는 .smol 파일에 직접 기록되어, 이후 모델 재학습이나 품질 검증 때 그대로 활용됩니다.
• 그림자 모드 사례 관리: Shadow Mode로 포착된 특이 케이스 영상을 .smol 형식으로 빠르게 압축·업로드하고, 중앙 서버에서 라벨 검수 후 다시 내려받아 재학습에 투입합니다.
- 기대 효과
• 데이터 엔진의 원활한 작동: 고효율·고정밀 데이터를 끊임없이 주고받을 수 있어, 테슬라의 신경망 업데이트 속도가 빨라집니다.
• 확장성: 향후 추가될 새로운 센서(예: 레이더 재도입, 초음파 등)가 생겨도 .smol 포맷의 섹션 구조나 버전 관리로 대응 가능하므로, 장기적으로 자율주행 연구에 유연하게 적응합니다.
'자율주행' 카테고리의 다른 글
FSD Networks in Car (0) | 2025.05.04 |
---|---|
FSD Lanes Neural Network (0) | 2025.05.01 |
End-to-End 학습의 개념: 입력부터 조향·제어까지 (0) | 2025.04.25 |
Motion Planning using Network TOO (0) | 2025.04.22 |
FSD Planning (0) | 2025.04.18 |