다하미커뮤니케이션즈, AI 학습용 뉴스 데이터 공급 서비스 출시

오동현 기자 2024. 1. 5. 17:44
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

다하미커뮤니케이션즈는 인공지능(AI) 학습을 위한 뉴스 데이터 공급 서비스 'NDPT(News data for Pre-Training)'를 출시했다고 5일 밝혔다.

'NDPT'는 고품질의 AI 학습용 뉴스 데이터 제공 서비스로 25년간 국내 저작권 유통 사업으로 확보한 지면뉴스에서 온라인, 방송 뉴스, 보도사진까지 저작권이 해결된 안전한 데이터를 제공한다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

합법적으로 AI 학습에 최적화된 뉴스 데이터 제공
텍스트·이미지·영상 등 뉴스데이터를 정교하게 가공


[서울=뉴시스] 오동현 기자 = 다하미커뮤니케이션즈는 인공지능(AI) 학습을 위한 뉴스 데이터 공급 서비스 'NDPT(News data for Pre-Training)'를 출시했다고 5일 밝혔다.

'NDPT'는 고품질의 AI 학습용 뉴스 데이터 제공 서비스로 25년간 국내 저작권 유통 사업으로 확보한 지면뉴스에서 온라인, 방송 뉴스, 보도사진까지 저작권이 해결된 안전한 데이터를 제공한다.

또한 AI빅테크 기업에서 필요로 하는 대형 언어모델(LLM) 및 대형 다중유형 모델(LMM) 구축에 자사의 기술이 접목된 학습용 데이터인 'NDPT'를 사용하면 AI 학습에 최고의 결과를 얻을 수 있을 거라고 다하미 관계자는 말했다.

이번에 출시한 'NDPT' 서비스는 국내 최대의 뉴스 데이터를 텍스트, 이미지, 영상 등 다양한 형태로 보유하고 있다. 여기에 163만 건(하루 평균 200여개)의 정부부처 보도자료까지 확보하고 있어 다양하고 신뢰성 있는 데이터 학습으로 최적의 품질과 데이터 유용성을 보장한다.

뉴스는 정치, 경제, 사회, 문화 등 다양한 주제의 정보를 다루며 지속적으로 발생하기 때문에 AI가 최신 정보를 학습하고 실시간으로 변화하는 상황을 이해하는데 적합하지만, 데이터가 정확하지 않은 경우 학습이 제대로 진행되지 않을 수 있어 양질의 신뢰성 있는 데이터 확보가 관건이다.

'NDPT'는 정확하고 신뢰성 높은 AI 학습 데이터를 제공하기 위해 자사의 특화된 AI 프레임워크인 'dAIa(Dahami Artificial Intelligence Application)'를 적극 활용한다. 이 프레임워크는 국내 뉴스 데이터를 세밀하게 정제하고 검수하는 과정을 거쳐 데이터의 품질을 극대화한다.

다하미에서 출시한 'NDPT' 서비스는 데이터 제공 범위 및 가격 등이 구체적으로 정해지지 않은 시장 환경에서 많은 언론사와 개별적으로 계약하는 번거로움을 줄이고 국내 언론사와의 저작권 계약을 한 번에 해결 가능하도록 설계된 서비스다.

한국언론진흥재단의 공식 유통사이자, 국내 최대 뉴스 유통 전문업체인 다하미는 지면, 온라인, 방송뉴스를 스크랩하고 보고서로 완성하는 '스크랩마스터'를 세계 최초로 개발했으며, 보도자료 집계 시스템 '피알꼭' 등 뉴스 콘텐츠 솔루션을 접목시킨 기술에 대해 개발, 적용시키는 연구를 계속 진행 중이다.

또한 2016년부터 매년 고용노동부에서 선정하는 '청년친화강소기업' 자격을 9년째 유지 중이다.

☞공감언론 뉴시스 odong85@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?