무하유, ‘초거대 AI 데이터 구축사업’ 주관기업 선정
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
자연어를 이해하는 실용 인공지능(AI) 기술 기업 무하유가 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 추진하는 '2024년 초거대 AI 데이터 구축사업'의 주관기업으로 선정됐다고 7일 밝혔다.
무하유는 지난 13년간 AI 기반 학술논문 전문 표절검사 서비스 '카피킬러'를 운영하며 축적한 자연어 이해(NLU) 전문성 및 학술 논문 내용에 대한 높은 이해도를 바탕으로 안정적으로 데이터를 구축해왔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
데이터 수집부터 모델링까지
AI 모델 제작을 위한 전 과정 담당
무하유는 해당 사업 내 교육 영역의 ‘학술논문 이해 데이터’ 구축을 담당한다. 일반인들도 학술 논문을 쉽고 빠르게 이해할 수 있도록 ‘CC-BY 라이선스’ 형태의 학술 논문 1만 건에 대한 포스터 생성을 돕는다.
포스터 생성을 위한 논문 요약, 핵심 표·그림 선정, 표·그림에 대한 설명문 작성 등을 지원하는 학습 데이터를 구축하고 AI 모델을 개발할 예정이다. 데이터 수집부터 모델링까지 AI 모델 제작을 위한 전 과정을 도맡는다. 이를 통해 수작업으로 진행할 경우 많은 시간이 소모되는 학술논문 포스터 제작을 자동화한다는 목표다. 학술 논문 전문 중 포스터에 활용될 영역을 매핑하는 데이터를 라벨링하는 게 핵심이며, 라벨링 과정에는 국내 연구기관 출신의 석·박사급 인재를 고용해 정확도를 높일 계획이다.
무하유는 지난 13년간 AI 기반 학술논문 전문 표절검사 서비스 ‘카피킬러’를 운영하며 축적한 자연어 이해(NLU) 전문성 및 학술 논문 내용에 대한 높은 이해도를 바탕으로 안정적으로 데이터를 구축해왔다.
특히 텍스트 처리 노하우는 물론, 이미지·오디오·영상 등 다양한 형태의 데이터를 분석하고 동시 처리할 수 있는 ‘멀티모달’ 기술력이 높게 평가됐다. 단순히 논문의 텍스트를 요약하는 데 그치지 않고, 논문 내 이미지들과 텍스트 내용 간의 유기적인 상관관계를 데이터로 옮겨야 하기 때문이다. 무하유는 AI 면접 평가 서비스 ‘몬스터’를 개발 및 운영하며 이미지·영상·음성 등 복잡한 데이터를 분석하고 평가하는 노하우를 쌓아왔다.
이번 사업에는 품질관리 전문기업 더테스트가 참여해 구축 데이터의 품질을 보증할 예정이다. 주관기관이 구축 과정에서 자체 검증한 데이터를 교차 검증해 데이터 품질을 제고한다.
신동호 무하유 대표는 “무하유는 AI 기반의 논문표절 검사, 서류 분석, 비대면 면접 등 다양한 서비스를 자체 개발해 운영하고 있으며, 이를 위한 AI 모델 개발 관련 석박사급 인력을 다수 보유하고 있어 분야 전문성이 우수하다”라며 “자체 보유한 데이터 팩토리를 통해 신뢰할 수 있는 고품질 데이터를 대량 구축할 수 있어 공공부문에서의 구축 사례가 늘고 있다”라고 설명했다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “금메달 축하한 것 뿐인데”…양궁 3관왕 임시현에 댓글 단 안산 ‘날벼락’ - 매일경제
- “망한 올림픽인줄 알았는데”…金 11개 쓸어담는 반전에 삼성 신났다, 왜? - 매일경제
- “금메달 딴 반효진 엄마, 이 회사 다니셨네”…부회장이 장학금 전달 - 매일경제
- 기초연금 받는 노인부부 인간답게 살려면...“한 달 214만원은 있어야” - 매일경제
- “스티브 잡스 딸과 열애중”… 파리 올림픽 금메달리스트의 정체 - 매일경제
- “가격보니 고민되네”...갤플립6보다 50만원이나 싼 ‘이 플립’ 출격 - 매일경제
- 트럼프 “북한, 훌륭한 부동산 갖고 있어…김정은은 똑똑하고 강인” - 매일경제
- “못생길수록 일찍 죽는다”…졸업앨범 65년 추적해보니 ‘충격’ - 매일경제
- “내 새끼랑 커피 마시고, 쇼핑하고, 호캉스 할래요”…반려동물 서비스 각양각색 - 매일경제
- 임영웅 축구 사랑 효과…노숙자월드컵 돕는 팬클럽 - MK스포츠