아하 커뮤니티, 고품질 한국어 코퍼스 데이터 시장 공급 본격화
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
소셜 Q&A 커뮤니티 '아하'를 운영 중인 아하앤컴퍼니 주식회사(대표 서한울)가 자사 서비스 내 축적된 고품질 한국어 데이터 판매를 본격적으로 시작했다고 16일 밝혔다.
특히 아하 커뮤니티는 활동하는 전문가를 대상으로 내부 정책에 따른 아하 지수 및 어뷰징 적발 알고리즘을 통해 답변자의 답변 퀄리티를 유지 중이며, 하기 기준들을 통한 답변자 내부 랭킹 산정 등 콘텐츠 QC 정책을 통해 고품질 한국어 데이터 생산 환경을 구축하고 있다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
소셜 Q&A 커뮤니티 ‘아하’를 운영 중인 아하앤컴퍼니 주식회사(대표 서한울)가 자사 서비스 내 축적된 고품질 한국어 데이터 판매를 본격적으로 시작했다고 16일 밝혔다. LLM을 자체 개발하거나 AI 및 데이터 관련 사업을 위해 고품질 한국어 데이터가 필요한 기업 등을 주요 잠재 고객으로 타기팅한다.
법률, 세금/세무, 인사/노무, 의료, 약료, 반려동물, 치과, 보험, 부동산 등 다양한 분야의 질문 및 전문가 답변 데이터가 주요 판매 상품이며, 1차적인 데이터 가공(개인정보 제거 등)이 선행돼 고객사의 검수 편의성 확보 및 학습 시 부적합한 답변 가능성을 줄여준다.
또한 아하 커뮤니티의 한국어 데이터는 질문 내용에 대한 답변만을 포함하고 있으며, 통상적인 짧은 문답이 아닌 특정 상황에 대한 자세한 답변으로 구성돼 있어 일반적인 한국어 데이터셋과 차별화된 강점을 보인다.
특히 아하 커뮤니티는 활동하는 전문가를 대상으로 내부 정책에 따른 아하 지수 및 어뷰징 적발 알고리즘을 통해 답변자의 답변 퀄리티를 유지 중이며, 하기 기준들을 통한 답변자 내부 랭킹 산정 등 콘텐츠 QC 정책을 통해 고품질 한국어 데이터 생산 환경을 구축하고 있다.
서한울 아하 커뮤니티 대표는 “2024년 2월 진행 예정인 웹/앱 대규모 리뉴얼 작업 이후 더 다양한 분야의 고품질 한국어 데이터 생산 환경이 구축될 것”이라며 “향후 고품질 한국어 데이터 생산을 기반으로 한 데이터 공급 비즈니스 확대를 통해 큰 규모의 매출 성장을 기대한다”고 말했다.
아하앤컴퍼니 소개
아하앤컴퍼니는 궁금한 점을 질문하면 다양한 분야의 검증된 전문가로부터 답변을 받을 수 있는 온라인 Q&A 커뮤니티 ‘아하’의 운영사다. ‘아하’는 커뮤니티 보상 시스템과 함께 한국판 ‘레딧’을 목표로 하고 있으며, 현재까지 누적 투자 유치 금액은 약 50억원이다. 주요 투자자로는 DSC인베스트먼트, 프라이머사제파트너스, 블루포인트, 센트럴투자파트너스 등이 있다.
이 뉴스는 기업·기관·단체가 뉴스와이어를 통해 배포한 보도자료입니다.
출처:아하앤컴퍼니
보도자료 통신사 뉴스와이어(www.newswire.co.kr) 배포
Copyright © 뉴스와이어. 무단전재 및 재배포 금지.
- 아이지, 반도체 플라즈마 응용 실습 장비 개발… 공급 본격화 - 뉴스와이어
- 원텍, 중국 SBT와 합작법인 설립 계약 체결 - 뉴스와이어
- 2024 코리아 메타버스 페스티벌, ‘메타버스 주간’ 운영 및 행사 연계 개최 - 뉴스와이어
- 한국디지털광고협회 ‘2024년 대한민국 디지털 광고 대상’ 개최 - 뉴스와이어
- 사랑의달팽이, 우리금융미래재단과 함께 청각장애인 101명에 소리 선물 - 뉴스와이어
- 일렉트로닉 월드 뮤직 듀오 애니멀다이버스, 두번째 정규 앨범 ‘Odyssey’ 발매 - 뉴스와이어
- 엔씨소프트, 국내 최초 LLM 성능 검증하는 ‘VARCO Judge LLM’ 출시 - 뉴스와이어
- 에쓰-오일토탈에너지스윤활유, 쿼츠 엔진오일 신규 광고 공개 - 뉴스와이어
- 국립나주병원, 직장인 정신건강 심포지엄 개최 - 뉴스와이어
- KOREA LIFE SCIENCE WEEK 2024 & KOREA LAB Autumn 2024 전시·컨퍼런스 개최 - 뉴스와이어