[데이터 구축 사례]실외 자율주행 이미지 AI 학습 데이터 라벨링/구축 프로젝트

자율주행 · 이미지 데이터 라벨링 사례

실외 자율주행 이미지 AI 학습 데이터 라벨링/구축 프로젝트
adc4e87e620fd.png

실외 도로 환경 이미지에 대해 Semantic Segmentation과 Object Detection을 결합한 정밀 어노테이션을 수행한 프로젝트 사례입니다.

프로젝트 개요

프로젝트 명
실외 자율주행 도로 객체 인식 어노테이션 데이터 구축
산업 분야
모빌리티·자율주행 산업입니다
데이터 유형
실외 도로 이미지 · Semantic Segmentation & Object Detection

d23abd1a4114a.png

  • 자율주행 차량의 도로 객체 탐지를 위해 실외 도로 환경 이미지를 활용한 AI 학습 데이터를 구축한 프로젝트입니다.
  • 교차로, 횡단보도, 인도, 차량 등 다양한 교통 환경이 포함된 실사 이미지를 대상으로 데이터 라벨링을 수행했습니다.
  • 도로, 횡단보도, 인도 등 배경·영역 정보는 Semantic Segmentation으로, 신호등 객체는 Object Detection으로 병행 가공했습니다.
  • 가려진 객체는 실제로 보이는 형상까지만 처리해, 예측 없이 신뢰도 높은 라벨링 품질을 확보했습니다.
  • 작업 결과는 JSON 포맷으로 클래스 및 위치 정보를 구조화해 제공하여, 바로 모델 학습 파이프라인에 연계 가능하도록 설계했습니다.
  • 전체 이미지 수는 약 수천~수만 건 규모로, 실서비스 수준의 자율주행 인식 모델 개발을 지원하는 데이터 구축 범위입니다.

주요 작업 내용

고객사가 제공한 실외 도로 이미지에 대해 별도 전처리 없이 바로 어노테이션을 수행하고, 자율주행 인식 모델에 최적화된 구조로 결과를 정리했습니다.

TASK작업 내용
요구사항 분석자율주행 인식 모델의 목표(도로/보행자 영역 분리, 신호등 탐지 등)를 기준으로 필요한 클래스 체계와 어노테이션 단위를 정의했습니다.
클래스·가이드 설계도로, 횡단보도, 인도, 자전거 도로, 사람, 연석 등 Semantic Segmentation 클래스와 보행자·차량 신호등 Object Detection 클래스를 체계화했습니다.
세그멘테이션 어노테이션이미지 내 도로 및 보행 환경을 픽셀 단위로 분할하고, 클래스 간 겹침을 최소화하는 기준에 따라 영역별로 정밀하게 라벨링했습니다.
객체 탐지 어노테이션보행자 신호등과 차량 신호등을 바운딩 박스로 표기하고, 가려진 신호등은 실제로 보이는 영역까지만 반영해 위치 정보를 정밀하게 기록했습니다.
품질 검수 및 보정클래스 혼동, 영역 누락, 중복 라벨링 등을 검수 프로세스를 통해 점검하며, 기준에 맞지 않는 어노테이션은 재작업·보정을 진행했습니다.
JSON 구조 설계·납품이미지별 클래스·좌표·마스크 정보를 JSON 형식으로 구조화하고, 고객사의 AI 학습 파이프라인에 바로 연동 가능한 스키마로 정리해 납품했습니다.
<!-- 흐름도 step chips -->
프로젝트 진행 흐름
52e9e06d759c6.png
1 요구사항 정리
2 클래스·가이드 설계
3 세그멘테이션 & Detection 라벨링
4 1차 검수 및 피드백 반영
5 2차 정밀 검수
6 JSON 포맷 최종 납품

구축 결과 및 시사점

구축 데이터 요약
  • 데이터 수량: 약 수천~수만 건 규모의 실외 도로 환경 이미지
  • 데이터 타입: 자율주행 차량 전방·주변을 촬영한 고해상도 도로 이미지
  • 라벨링 범주: 도로·횡단보도·인도·자전거 도로·사람·연석 등 Semantic Segmentation + 보행자/차량 신호등 Object Detection
  • 납품 형식: Semantic Segmentation 및 Object Detection 결과를 포함한 JSON 구조의 AI 학습 데이터

본 프로젝트를 통해 실외 자율주행 환경에 특화된 정밀 어노테이션 데이터를 구축함으로써, 도로 객체 인식 모델의 성능 향상에 기여할 수 있는 기반을 마련했습니다.

젠다이브(Gendive)의 데이터 구축 역량
  • 품질: 복합 객체 인식 및 분할에 특화된 어노테이션 설계를 통해, 클래스 간 경계를 명확히 하고 실제 보이는 형상만을 반영하는 기준으로 라벨링 품질을 관리합니다.
  • 관리: 프로젝트별 맞춤 품질관리 기준과 단계별 검수 프로세스를 수립해, 작업자·검수자 간 가이드 일관성을 유지하고 재작업을 체계적으로 통제합니다.
  • 확장성: 공공·민간 AI 데이터 구축 사업 경험을 바탕으로, 다른 도시·환경·센서(영상, 이미지 등)로 손쉽게 확장 가능한 데이터 구축 구조와 포맷을 제안합니다.

젠다이브 파트너 서비스

자율주행·모빌리티를 포함해 다양한 컴퓨터 비전 프로젝트에서, 데이터 수집 이후의 라벨링·검수·포맷 설계까지 통합 지원합니다.

젠다이브와 협업해야 하는 이유
  • 모델 목적에 맞춘 어노테이션 설계로, 단순 라벨링을 넘어 실제 서비스 성능에 연결되는 데이터 전략을 함께 수립합니다.
  • 기존 라벨링 업체보다 세분화된 가이드와 다단계 검수 체계를 통해, 대규모 프로젝트에서도 일관된 라벨링 품질을 유지합니다.
  • JSON, COCO, YOLO 등 다양한 포맷을 지원해, 별도 변환 작업 없이 곧바로 AI 학습 파이프라인에 적용 가능한 결과물을 제공합니다.

자율주행, 모빌리티, 영상 인식 등에서 데이터 라벨링AI 학습 데이터 데이터 구축이 필요하시다면, 프로젝트 초기 기획 단계부터 상담을 권장합니다.

현재 진행 중인 데이터 라벨링 프로젝트가 있다면, 품질 점검이나 검수 프로세스 개선 관점에서도 상담·의뢰를 도와드립니다.


담당: 젠다이브 데이터팀(프로젝트 상담·견적·파트너 협업 문의)

주식회사 젠다이브

대표 : 함민혁        

주소 : 광주광역시 동구 금남로 193-22, 광주AI창업캠프 3층 308호 / 

서울특별시 금천구 가산디지털1로 84, 3층 310호
사업자등록번호 : 449-87-02752        

대표번호 : 070-4895-5550        

E-mail : mh.ham@gendive.ai        

개인정보보호책임 : 함준혁(jh.ham@gendive.ai)

ⓒ gendive Inc. 2026

주식회사 젠다이브 대표 : 함민혁 주소 : 광주광역시 동구 금남로 193-22, 광주AI창업캠프 3층 308호 / 서울특별시 금천구 가산디지털1로 84, 3층 310호
사업자등록번호 : 449-87-02752 대표번호 : 070-4895-5550 E-mail : mh.ham@gendive.ai 개인정보보호책임 : 함준혁(jh.ham@gendive.ai)

ⓒ gendive Inc. 2026