방미통위, 2만여 시간 방송영상 AI 학습용 데이터 확보

박수형 기자 2026. 5. 7. 16:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

방송미디어통신위원회는 한국전파진흥협회(회장 홍범식)와 함께 7일 서울에서 '25년 방송영상 인공지능 학습용 데이터 구축 사업 성과공유회'를 열고 그간 구축한 인공지능 학습용 데이터를 공개했다.

방미통위는 방송미디어 산업 인공지능 혁신을 위해서는 고품질의 학습용 영상 데이터 확보가 무엇보다 중요하다는 판단에 따라 방송사가 보유하고 있는 뉴스, 다큐멘터리, 드라마 등 방대한 방송영상 자료의 가치에 주목하고 이를 인공지능 학습을 위한 데이터로 전환하는 사업을 지난해 추진했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

(지디넷코리아=박수형 기자)방송미디어통신위원회는 한국전파진흥협회(회장 홍범식)와 함께 7일 서울에서 ‘25년 방송영상 인공지능 학습용 데이터 구축 사업 성과공유회’를 열고 그간 구축한 인공지능 학습용 데이터를 공개했다.

방미통위는 방송미디어 산업 인공지능 혁신을 위해서는 고품질의 학습용 영상 데이터 확보가 무엇보다 중요하다는 판단에 따라 방송사가 보유하고 있는 뉴스, 다큐멘터리, 드라마 등 방대한 방송영상 자료의 가치에 주목하고 이를 인공지능 학습을 위한 데이터로 전환하는 사업을 지난해 추진했다.

이번 사업에는 총 200억 원의 예산이 투입됐으며, 200만 시간이 넘는 방대한 방송 원본 데이터 중 4만여 시간을 엄선해 정제 및 가공을 거쳤다. 이후 데이터 품질 검증을 통해 최종적으로 인공지능 학습을 위한 고품질 영상 2만 3113시간, 약 460만 개의 데이터 세트를 구축했다.

방송사가 보유하고 있는 방송영상 자료는 우리 사회 역사와 문화를 바탕으로 언어, 행동, 소리, 이미지 등 복합적 상황 정보를 풍부하게 담고 있어 인공지능 학습을 위한 최적의 원천데이터로 평가받는다.

이번에 구축된 방송영상 인공지능 학습용 데이터는 방송콘텐츠 제작 현장의 효율성을 높일 수 있는 인공지능 관련 서비스 개발부터 제조, 의료, 재난, 교통 등 타 산업 전반의 인공지능 개발에 활용돼 국가 인공지능 경쟁력 강화에 기여할 전망이다.

박동주 방미통위 사무처장은 “이번 사업이 방송미디어 산업의 인공지능 혁신을 위한 소중한 첫걸음이 될 것”이라며 “앞으로도 국내 방송미디어 산업이 인공지능을 발판 삼아 재도약할 수 있도록 관련 정책과 사업을 지속 추진해 나가겠다”고 말했다.

한편, 이날 성과공유회에는 KBS, MBC, MBC충북, KT ENA 등 4개 주관 방송사들과 네이버 클라우드, LG AI연구원 등 인공지능 전문기업 관계자를 비롯해 관련 분야 전문가, 일반 국민 등 100여 명이 참석했다.

박수형 기자(psooh@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.