엔비디아가 만든 '가상 한국인' 600만 명, 개발자 다운로드 1위

홍인택 2026. 4. 28. 13:22
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

그는 매주 화요일 저녁 지역 배드민턴 클럽에서 땀을 흘리며, 주말에는 사려니숲길이나 1100고지 풍경을 즐기며 여유롭게 시간을 보낸다.

실제로 있을 법한 유씨는 엔비디아가 생성해낸 600만 명의 '가상 한국인' 중 한 명이다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

실제 통계 반영 가상 한국인 데이터
AI 개발 플랫폼서 다운로드 1위 기록
공공 연구, 소비자 분석에 활용 가능
21일 서울 마포구 마포 프론트원에서 열린 엔비디아 '빌드 어 클로(Build-a-Claw)' 행사에서 참석자들이 자율형 인공지능 에이전트를 체험하고 있다. 뉴시스

# 공인중개사 유준호(61)씨는 제주시 노형동의 좁은 골목길 필지 하나하나의 주인과 경계를 전부 꿰고 있다. 그는 매주 화요일 저녁 지역 배드민턴 클럽에서 땀을 흘리며, 주말에는 사려니숲길이나 1100고지 풍경을 즐기며 여유롭게 시간을 보낸다. 노형동 일대의 도시화 과정을 직접 겪었으며, 아파트에서 배우자, 자녀와 함께 살고 있다. 자녀들이 제주에 안착할 기반을 마련하기 위해 수익이 계속 나는 관리형 부동산 매물을 확보하는 게 요즘 관심사다.

실제로 있을 법한 유씨는 엔비디아가 생성해낸 600만 명의 '가상 한국인' 중 한 명이다. 엔비디아는 이름, 성별, 나이, 혼인 상태, 교육 수준 등의 인구통계 특성을 반영한 600만 건의 가상 한국인 데이터 묶음인 '네모트론 페르소나 코리아'가 글로벌 인공지능(AI) 플랫폼 허깅페이스에서 데이터셋 부문 다운로드 1위를 기록했다고 28일 밝혔다.

네모트론 페르소나 코리아는 국가통계포털, 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버클라우드에 있는 한국인 관련 민관 데이터를 기반으로 합성됐다. 이름과 나이, 혼인 여부 같은 자세한 정보가 담겨있지만, 모두 통계에 기반해 생성된 가상 데이터여서 개인정보보호법을 위반하지는 않는다는 설명이다.

엔비디아가 밝힌 이 데이터셋의 목표는 한국의 자체 개발(소버린) AI가 학습할 수 있도록 편향되지 않은 데이터를 구축하는 데 있다. 오픈소스로 공개돼 국내외 개발자들이 자유롭게 쓸 수 있어, 사회과학 연구나 기업 소비자 분석에도 활용 가능하다. 엔비디아는 "기존 페르소나 데이터셋의 편향을 완화하는 게 주요 목표"라고 했다.

홍인택 기자 heute128@hankookilbo.com

Copyright © 한국일보. 무단전재 및 재배포 금지.