[AI픽] 과기정통부, 자율주행 AI 개발용 데이터 장벽 허문다
데이터 수집부터 라벨링까지 전 주기 절차·규격 제시
![자율주행차 (PG) [박은주 제작] 사진합성·일러스트](https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/19/yonhap/20260619120205010hnva.jpg)
(서울=연합뉴스) 권하영 기자 = 정부가 자율주행 인공지능(AI) 개발에 필요한 학습데이터를 확보하기 위한 데이터 레퍼런스 정립에 나섰다.
과학기술정보통신부는 자율주행 AI 개발용 학습데이터를 산·학·연이 공동 구축하고 상호 공유할 수 있도록 '자율주행 E2E 데이터 구축 가이드라인 및 규격 정의서'를 발간했다고 19일 밝혔다.
최근 글로벌 자율주행 업계는 대량의 데이터를 학습한 AI 하나가 인지·판단·제어를 통합 수행하는 엔드투엔드(E2E) 방식으로 빠르게 전환되고 있다.
미국 웨이모와 중국 바이두 등 글로벌 선도 기업들도 실증 거리를 확대하며 학습데이터 구축량을 늘리는 데 주력하는 추세다.
반면 국내는 각 기업·기관이 학습데이터를 개별적으로 구축하고 있어 차종별 센서 위치 차이 등으로 데이터 상호 공유가 어려운 상황이다.
이번 가이드라인은 자율주행 E2E AI 학습에 필수적인 데이터 전 주기를 포괄한다.
먼저 데이터 수집·가공·정합·보정·라벨링 등 학습데이터 구축 절차를 정의하고, 센서 구성과 저장 포맷 등 수집 시스템 요구사항 및 원시데이터 검증 방법을 제시한다.
이어 시나리오 선별 등 데이터 가공 방법, 위치 보정·공간 정합 등 정합·보정 방법, 라벨링 항목과 학습데이터 셋 규격 등 라벨링 방법을 담았으며, 이를 기반으로 구축한 학습데이터 사례도 수록했다.
가이드라인은 범부처 '자율주행 기술개발 혁신사업' 과제를 통해 개발됐으며, 정보통신기획평가원(IITP)과 자율주행기술개발혁신사업단(KADIF), 한국전자통신연구원(ETRI)이 주도했다.
과기정통부는 향후 국토교통부와 협력해 도시 단위 대규모 E2E AI 학습데이터 구축을 지원하는 자율주행 실증도시 등에 실제 활용하면서 가이드라인을 보완해나갈 계획이다.
kwonhy@yna.co.kr
▶제보는 카톡 okjebo
Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지
- 영암 조선소 부두 정박용 밧줄 터져 40대 노동자 사망 | 연합뉴스
- '주차갈등'에 프로야구 선수 가족 스토킹, 50대 이웃 검거 | 연합뉴스
- 박서진, 서울 앙코르 공연 취소…'잠실 개표소 봉쇄 시위' 여파 | 연합뉴스
- 데플림픽 메달리스트 청각장애인 태권도 선수 숨져 | 연합뉴스
- 남양주 골목길에 누워있던 여대생 택배차에 치여 숨져 | 연합뉴스
- 서울시 '지하철 무임 70세·버스로 확대' 공청회…사회적합의 이룰까(종합) | 연합뉴스
- 대한적십자사 새 회장에 인요한 전 국민의힘 의원 | 연합뉴스
- '참교육' 현실이었네…한 고교서 48명 사이버도박 자진신고 | 연합뉴스
- 음성군 아파트서 5천만원 보이스피싱 당한 모자 숨진 채 발견 | 연합뉴스
- 정이한 '자작극 의혹' 파문 확산…학력·주변인까지 논란 | 연합뉴스