"생성 AI 등장, 뉴스 제공자 입장에선 새로운 시장 열린 것"
어플라이드XL, 챗GPT 최소 20개 언론 뉴스 데이터 학습 밝혀내
"해외 언론사들, AI 기업들에 연간 65억5000만원~261억 8000만원 제시"
네이버, 하이퍼클로바X 출시 후 언론과 협상 시작할 듯
[미디어오늘 박서연 기자]
“6개월도 지나기 전에 생성 AI 경쟁은 언론사와 이미지 에이전시를 대상으로 한 빅데이터 확보전으로 확전된 분위기다. 이 과정에서 적절한 양질의 테스트와 이미지 빅데이터를 확보한 생성AI는 성능이 빠르게 향상되면서 사용자를 더 빠르게 확보해 나갈 가능성이 높다. 특히 언론사의 최신 뉴스를 업데이트 받지 못한 생성AI는 도태될 가능성이 높다.”
지난 3월 일론 머스크(테슬라 최고경영자)와 스티브 워즈니악(애플 공동창업자), 유발 하라리 등 1280명 정도의 IT 거물과 지식인들이 6개월 동안만 AI 개발을 멈추자고 제안했다. 오픈AI의 챗GPT가 등장하고 이보다 더 성능이 좋은 생성 AI가 나오면서 적절한 규제와 안정망이 마련될 때까지 AI 개발을 잠시 중단하자고 했지만, 결국 유야무야됐다.
17일 한국언론진흥재단이 발간한 '해외 미디어 동향, 챗GPT : 미디어의 기회인가, 위기인가?' 보고서에서 신기주 더밀크코리아 부대표는 '에이지 오브 AI' 주제로 글을 썼다.
보고서에 따르면 지난 2월15일 데이터 추적 플랫폼 어플라이드XL(AppliedXL)의 프란체스코 마르코니(Francesco Marconi) CEO는 챗GPT가 최소 20개 이상의 글로벌 언론사가 생산한 뉴스 데이터를 학습했다는 사실을 밝혀냈다. 프란체스코 마르코니 CEO는 월스트리트저널의 기자 출신이다.
프란체스코 마르코니 CEO는 '챗GPT는 어떤 뉴스 서비스로 훈련받았지? 챗GPT의 데이터베이스를 기반으로 상위 뉴스 서비스 리스트를 출력해줘'라고 요청했다. 그 결과 로이터, 뉴욕타임즈, 가디언, BBC, CNN, 알자지라, 워싱턴포스트, 블룸버그, 파이낸셜타임즈, 이코노미스트, 와이어드, 포춘, 포브스, 비즈니스 인사이더, 월스트리트저널 등이 출력됐다.
보고서는 “마르코니의 고발 이후 월스트리트저널은 즉각 챗GPT의 개발사 오픈AI에 대한 소송을 준비하기 시작했다. 오픈AI가 챗GPT를 트레이닝하는 과정에서 저작권이 월스트리트저널에 있는 뉴스 콘텐츠를 무단으로 이용한 부분을 문제 삼았다”고 했다.
실제로 지난 13일(현지시간) 챗GPT 개발사 오픈AI가 미국 뉴스 통신사 AP통신과 기사 사용 등에 대한 계약을 맺었다고 발표했다. AP통신은 1985년부터 생산해 온 뉴스콘텐츠를 챗GPT를 학습시키는 데 이용할 수 있도록 했다. 그러나 거래 금액은 공개되지 않아 알 수 없다. 이 같은 소식 알려진 건 오픈AI가 이미지 생성 AI 달리(DALL-E)의 훈련을 위해 이미지 영상 콘텐츠 제공 업체인 셔터스톡과 계약했다고 밝힌지 하루 만이다.
보고서는 “뉴스 미디어로 대표되는 이른바 콘텐츠 생산자 진영이 정말 원하는 건 챗GPT가 더 이상 뉴스를 보지 못하게 하는 것이 아니다. 오픈AI로 대변되는 AI 기술 진영이 머신러닝에 필수요소인 뉴스 데이터에 정당한 비용을 지불하게 만드는 것”이라며 “디지털 혁신이 콘텐츠의 유통 방식을 근본적으로 변화시킨 이후 콘텐츠 생산자 진영이 원하는 건 언제나 똑같았다. 기술 기업으로부터 콘텐츠에 대한 대가를 받아내는 것”이라고 설명했다.
지난해 12월 챗GPT가 등장하고 7개월이 지났다. 글로벌 미디어그룹들과 생성AI를 개발한 빅테크 기업들은 가격 협상을 진행 중이다. 국내에서도 오는 8월24일 네이버는 거대언어모델 하이퍼클로바X 출시를 앞두고 있다. 네이버는 관련 서비스 출시 이후 언론사와 가격 협상에 나설 것으로 보인다.
지난 6월17일(현지시간) 파이낸셜타임즈에 따르면 미국의 미디어그룹인 뉴스코퍼레이션과 뉴욕타임스, 독일의 악셀 슈프링어, 영국의 가디언 등의 언론사들이 각각 적어도 한 곳 이상의 기술 기업과 논의를 진행하고 있다. 협상 대상 생성AI 기술 기업은 챗GPT 개발사 오픈AI와 코파일럿 개발사 마이크로소프트, 바드 개발사 구글, 파이어플라이 개발사 어도비 등이다.
보고서는 “파이낸셜타임즈 보도에서 언급된 언론사들이 소유한 미디어는 뉴욕타임즈, 가디언, 월스트리트저널, 폴리티코, 비즈니스 인사이더다. 모두 지난 2월 데이터 추적 플랫폼 어플라이드XL의 프란체스코 마르코니 CEO가 언급했던 미디어들”이라고 했다.
생성 AI 등장이 뉴스 콘텐츠의 소비시장을 인공지능으로 확장할 기회라고도 했다. 보고서는 “파이낸셜타임즈에 따르면 언론사들이 기술 기업들에게 제시한 금액은 연간 500만 달러에서 2000만 달러 선이다. 한화로는 65억5000만 원에서 261억8000만 원 선이다. 이는 언론사당 비용이다. 뉴스텍스트로 세상을 배우는 생성AI의 등장은 뉴스 제공자 입장에선 새로운 시장이 열린 셈이다. 뉴스 소비를 인간지능에서 인공지능으로 확장할 기회인 것”이라고 했다.
해외 언론사 중 블룸버그는 유일하게 생성 AI 블룸버그GPT를 만들어 논문으로 공식 인정까지 받았다. 보고서는 “대부분의 언론사가 기술 기업과의 퍼블리싱 계약에 집중하는 상황에서 특정 언론에 파인튜닝된 생성 AI를 개발했다는 점에서 예외적”이라며 “물론 체급면에서 다른 생성AI와 비교하면 라이트급이다. 개발 비용은 한화로 약 35억3400만 원 정도”라고 했다.
보고서에 따르면 챗GPT는 막대한 컴퓨팅 파워가 필요한 탓에 하루 유지 비용만 70만 달러에 달하는데, 한화로 9억1600만 원이다. 네이버는 2022년 한 해 동안 1조 8090억 원의 연구개발비를 썼다. 2021년 1조6000억 원에 비해 2000억 원 이상 증가한 액수다. 블룸버그GPT에 투자된 금액은 언론사 기준으로 최대지만 생성AI 기준으론 최소다.
그러나 블룸버그GPT는 '기자'의 역할을 하지는 않는다. 보고서는 “블룸버그GPT가 이렇게 저비용으로 개발될 수 있었던 건 블룸버그가 양질의 데이터 세트를 가진 언론사이기 때문”이라면서도 “블룸버그GPT가 블룸버그 뉴스에 금융 분석 기사를 작성하는 것에 관해선 블룸버그 스스로도 거리를 두고 있다. 대부분 복잡한 금융 정보의 핵심을 요약해 주는 것에 초점이 맞춰져 있다. 뉴스를 쓰는 게 아니라 데이터를 분석하는 것이다. 논문에 따르면 재무 데이터 분석과 위험평가 그리고 회계와 감사 작업의 자동화가 핵심 기능이다. 새로운 기사를 생성한다기보단 생성된 정보를 재가공하는 것”이라고 했다.
미디어오늘을 지지·격려하는 [가장 확실한 방법]
Copyright © 미디어오늘. 무단전재 및 재배포 금지.
- ‘엘리엇 1400억 원 배상 누구 탓일까’ 칼럼은 한참 잘못됐다 - 미디어오늘
- ‘미국 외 정상은 처음’ 미 핵잠수함 올라탄 윤 대통령 평가는 - 미디어오늘
- 윤석열, 방통위 공석 방치…“한 명만 남을수도” - 미디어오늘
- [영상] 민주, 尹 이권카르텔 환수 수해복구 발언에 “검찰 특활비가 이권카르텔” - 미디어오늘
- KBS, 공적 책임 공론조사 진행하기로 - 미디어오늘
- 김의겸 궁평지하차도 망언, 민주당에서도 비판 쏟아져 - 미디어오늘
- 정광재 MBN 기자, 총선 출마 위해 퇴사 - 미디어오늘
- 언론재단 노조, 이사장-본부장 항명 파동에 “이게 회사냐” - 미디어오늘
- “윤 대통령, 이권카르텔 수해복구 무슨 관계냐” 묻자 국힘 답변은 - 미디어오늘
- [영상] 윤 대통령 이권카르텔과 수해복구 연계 부적절 지적에 윤재옥 “예산 낭비 줄이자는 것”