AI용 공개 데이터 활용 지침 나왔는데…기업 절반도 안 봐
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
정부가 생성형 인공지능(AI) 모델 훈련 개발을 위한 공공 데이터 활용 지침을 내놨으나 이에 대한 업계 관심이 저조한 것으로 나타났다.
22일 본지 취재 결과 생성형 AI 서비스를 개발하거나 운영 중인 개발사 다수가 관련 가이드라인을 담은 안내서를 아예 모르거나 확인하지 않은 것으로 전해졌다.
앞서 개인정보보호위원회는 지난 17일 생성형 AI 개발에 활용할 '인터넷상 공개 데이터'를 안전하게 처리할 수 있는 기준을 내놨다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=김미정 기자)정부가 생성형 인공지능(AI) 모델 훈련 개발을 위한 공공 데이터 활용 지침을 내놨으나 이에 대한 업계 관심이 저조한 것으로 나타났다.
22일 본지 취재 결과 생성형 AI 서비스를 개발하거나 운영 중인 개발사 다수가 관련 가이드라인을 담은 안내서를 아예 모르거나 확인하지 않은 것으로 전해졌다.
앞서 개인정보보호위원회는 지난 17일 생성형 AI 개발에 활용할 '인터넷상 공개 데이터'를 안전하게 처리할 수 있는 기준을 내놨다. AI 개발·훈련에 필수적인 공개 데이터가 현행 개인정보 규율체계 내에서 적법하고 안전하게 처리될 수 있도록 만든 가이드라인이다. 개인정보위는 해당 내용을 담은 안내서도 동시에 발간했다.
공개 데이터는 인터넷상 누구나 합법적으로 접근할 수 있는 데이터다. 이 공개 데이터는 오픈AI 챗GPT 등 생성형 AI 서비스 개발을 위한 엔진 역할을 한다. AI 기업들은 커먼크롤를 비롯한 위키백과, 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 방식으로 수집해 AI 학습데이터로 활용하고 있다.
그동안 AI 업계는 모델이나 서비스 개발에 공공 데이터를 사용할 때 마땅한 기준이 없어 혼선을 빚었다. 정부는 이번 가이드라인이 기업들에게 명확한 공공 데이터 활용법을 제시할 것으로 기대했다.
AI 개발사는 발표 소식을 전혀 모르고 있거나 안내서를 확인하지 않는 경우가 다수였다. 업계 관계자는 "이 기준이 천편일률적인 필수 규제가 아닌 자율성이기 때문"이라며 "정부가 기업에 해당 내용을 지속적으로 알려야 할 것"이라고 본지에 강조했다.
기업이 해당 지침을 실제 업무에 적용하기까지 시간 걸릴 것이라는 분석도 나왔다. 한 AI 스타트업 대표는 "말 그대로 법적 강제성 없는 가이드라인이라 기술적, 관리적 안전조치를 개별 기업·개인이 자율적으로 추진해야 한다"며 "구체적 방법론에 있어서는 여전히 모호함이 존재한다"고 지적했다.
그는 "특히 가이드라인에서 '정당한 이익' 기준 중 하나인 '구체적 이익형량' 등 객관적 판단이 힘든 영역이 존재"한다며 "다툼 소지가 많을 것으로 예상된다"고 설명했다.
김미정 기자(notyetkim@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- '챗GPT' 등 AI 개발엔진, '공개 데이터' 처리 기준 나왔다
- [현장] "AI 개발용 공개 데이터 처리법, 필수 아닌 선택"
- "애플, 화웨이에 빼앗긴 中 시장 되찾으려면 AI 필수"
- "제조업 AI 도입은 선택이 아닌 필수"...민·관, 2.5兆 쏟는다
- 지스타2024 막 올라…미공개 게임대작 대거 공개
- "하필 수능날 날벼락"…경기 지역서 나이스 먹통, 1시간여 만에 복구
- 아파트 주차장서 또 벤츠 전기차 화재…이번엔 국내산 배터리
- 경계 사라진 비즈니스...엔비디아·어도비 등 ‘빅테크 혁신 팁’ 푼다
- 이석우 두나무-마이클 케이시 DAIS 협회장 "블록체인 산업, 외부 의존도 낮춰야"
- 주총 표대결 앞둔 최윤범 "충분히 이길 수 있는 싸움"