동아 'AskBiz', SBS '폴리스코어'… 생성형AI 서비스 첫 발

최승영 기자 2023. 12. 12. 23:16
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

국내 언론사들 잇따라 서비스 출시
챗봇 등 신기술로 독자와 소통

생성형 AI를 활용한 서비스가 국내 언론에서도 속속 등장하고 있다. 일반 독자를 대상으로 한 챗봇 형태의 콘텐츠 서비스부터 뉴스룸 내 제작을 돕는 도구까지, 신기술의 등장에 언론사들이 적극 고민하고 자생적인 대응을 실행했다는 점에서 고무적인 사례다. 특히 ‘환각’ 문제 해소처럼 향후 이런 시도가 계속될 때 결국 마주할 주요 고민을 먼저 드러내는 케이스로서 언론계에선 참고할 만하다.

생성형 AI를 활용한 서비스가 국내 언론에서도 속속 등장하고 있다. 사진은 동아일보의 경제·경영 뉴스 AI 챗봇 ‘AskBiz’ 데모 페이지.

지난 6일 한국언론진흥재단이 주최한 ‘뉴스빅데이터와 생성형 AI의 미래’ 컨퍼런스에선 동아일보의 경제뉴스 AI 챗봇 ‘AskBiz’(가칭)의 사례가 발표됐다. 동아일보 미래전략연구소와 빅스터가 공동 개발한 서비스는 DBR과 HBR코리아 같은 동아일보 경제·경영 전문 콘텐츠, 박영사 서적 데이터 등을 파인튜닝해 생성형 AI에 학습시키고 독자에게 맞춤형 정보를 대화 형태로 전한다. ‘착한 디자인이 무엇인지’를 질문하면 답변을 해주고 하단에 출처를 노출하는 식이다. 내부 클로즈베타 테스트 등을 거쳐 조만간 동아닷컴 등에서 오픈을 예정했다.

특히 자체적으로 언어모델(LLM)을 구축했다는 특징을 지닌다. 최근 오픈소스의 경량 언어모델(sLLM)에 기반해 특정분야 전문성을 강화한 모델을 직접 개발하는 기업이 느는 상황에서 빅테크 API를 쓰지 않는 길을 택했다. 이현종 빅스터 대표는 이날 발표에서 “챗GPT와는 무관한 자체 모델에서 나온 답변이고, (국내) 미디어 분야에선 최초가 아닐까 싶다”면서 보안, 정확성, 비용에 대한 고려가 있었다고 설명했다. 그는 “내부 데이터가 외부로 유출될 수 있다는 고민에서 기술은 어렵지만 자체 서버에 데이터를 두는 AI 개발을 선택했다”면서 “외부 API 사용 시 토큰당 과금이 되는데 아무리 싸졌다고 해도 사용량이 많아지면 한 달에 2000만~3000만원씩 나오는 건 일도 아니다. 비용 고민도 안 할 수 없었다”고 말했다.

뉴스 미디어 분야 생성형 AI 서비스의 지향점으로 최신성, 고유성 등이 언급되기도 했다. 뉴스 속성상 정교한 데이터의 주기적인 업데이트가 필요하고, 여타 플랫폼에서 볼 수 없는 배타적인 내용이 필수란 지적이다. 그는 “최신 데이터가 계속 들어가야 하는데 격주 발행되는 DBR의 데이터를 1분기에 한 번씩 벡터DB를 자동 증분하는 방식으로 현재 설계가 구현돼 있다”면서 “현재 경제·경영 분야만 다루고 있는데 결국 포털이나 검색엔진에서 볼 수 없는 답변을 하는 고유 콘텐츠를 학습하는 게 굉장히 중요하고, 이 고유성이 뉴스 미디어 분야가 생성형 AI 서비스에서 돈을 벌 유일한 방법이라 본다”고 강조했다.

생성형 AI를 활용한 서비스가 국내 언론에서도 속속 등장하고 있다. 사진은 SBS의 정치인 이슈 요약 AI 서비스 폴리스코어의 폴리챗 인터페이스.

SBS는 언더스코어와 협업한 결과물 ‘폴리스코어’를 스브스프리미엄을 통해 이미 선보이고 있다. 해당 서비스는 언론재단 ‘빅카인즈’에 제공되는 60여개 언론사 뉴스를 지속 수집해 주요 정치인 33인의 관련 이슈를 DB화하고 대시보드 또는 챗봇 형태로 요약 전달한다. 로그인한 유료 플랫폼에서 일반 대중이 자유롭게 이용할 수 있고, 주간 정치 관련 지표를 소개하는 자사 코너에도 활용 중이다. 정치인 관련 소셜미디어 데이터, 뉴스 하단 댓글 등도 수집해 향후 고도화 작업에 반영할 계획이다.

특히 생성형 AI의 ‘환각(halluci nation)’ 현상에 대한 대비를 살펴봄직하다. 폴리스코어의 경우 정치 이슈와 무관한 질문에 답을 하지 않도록 설계가 됐다. 또 챗GPT의 API를 쓰지만 검색증강생성(RAG) 기술을 사용해 개발사 오픈AI 데이터가 아니라 자체 구축한 DB를 참조해 독자들에게 답변토록 했다. 배여운 SBS 기자는 지난 6일 컨퍼런스에서 “할루시네이션은 ‘오보’이고, 언론사로선 민감할 수밖에 없기 때문에 고민한 결과”라면서 “지난 3개월 간 계속 모니터링을 했는데 아직까지 문제가 된 적은 없었다”고 설명했다. 생성형 AI를 서비스화할 때 이는 정확도가 생명인 언론이 지속 고민할 부분으로 남는다. 실제 동아일보 AskBiz의 경우에도 ‘환각’을 방지하기 위해 ‘가중치를 바꾸는 방식의 20여 차례 파인튜닝’, ‘정교한 데이터 샘플링과 프롬프트 튜닝’, ‘RAG 기술적용’ 등 과정이 불가피했다.

지역일간지 영남일보는 일반 독자를 대상으로 한 콘텐츠 서비스가 아니라 뉴스룸 내 기자 등을 지원하는 생성형 AI 툴을 만든 사례로서 특이하다. 매체는 올해 온라인 기사 작성 시 적절한 이미지가 없을 때 핵심 단어·문장 등을 입력하면 그래픽·일러스트를 만들어주는 ‘AI 기사 이미지 생성 서비스’를 개발했다. 지역 개발업체와 협업한 결과물은 내년 뉴스룸에 도입될 예정이다. 별도로 AI 드로잉 프로그램을 통한 초·중·고교 학생 대상 교육사업도 진행 중이다.

박종문 영남일보 편집국 부국장은 지난 7일 본보와 통화에서 “텍스트가 좋아도 이미지가 없으면 가독성이 떨어지는데 적당한 이미지가 없는 경우가 많아 보완하려 했다. 웹 기준으로 개발했지만 효과가 괜찮다면 신문에도 쓸 수 있을 것으로 본다”며 “자체 사진DB를 넣어 대구경북 이미지 비중을 높이고 적합한 사진을 추천해주는 기능 등도 구현하려 했는데 한 각도에서만 찍은 신문용 사진의 한계로 아쉬움이 있었다. 향후 지역 공공기관의 무료 이미지를 추가하고 기자들의 숙련화, 프로그램 고도화 등을 진행할 예정”이라고 했다.

Copyright © 기자협회보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?