엔비디아가 만든 '가상 한국인' 600만 명, 개발자 다운로드 1위
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
그는 매주 화요일 저녁 지역 배드민턴 클럽에서 땀을 흘리며, 주말에는 사려니숲길이나 1100고지 풍경을 즐기며 여유롭게 시간을 보낸다.
실제로 있을 법한 유씨는 엔비디아가 생성해낸 600만 명의 '가상 한국인' 중 한 명이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
AI 개발 플랫폼서 다운로드 1위 기록
공공 연구, 소비자 분석에 활용 가능

# 공인중개사 유준호(61)씨는 제주시 노형동의 좁은 골목길 필지 하나하나의 주인과 경계를 전부 꿰고 있다. 그는 매주 화요일 저녁 지역 배드민턴 클럽에서 땀을 흘리며, 주말에는 사려니숲길이나 1100고지 풍경을 즐기며 여유롭게 시간을 보낸다. 노형동 일대의 도시화 과정을 직접 겪었으며, 아파트에서 배우자, 자녀와 함께 살고 있다. 자녀들이 제주에 안착할 기반을 마련하기 위해 수익이 계속 나는 관리형 부동산 매물을 확보하는 게 요즘 관심사다.
실제로 있을 법한 유씨는 엔비디아가 생성해낸 600만 명의 '가상 한국인' 중 한 명이다. 엔비디아는 이름, 성별, 나이, 혼인 상태, 교육 수준 등의 인구통계 특성을 반영한 600만 건의 가상 한국인 데이터 묶음인 '네모트론 페르소나 코리아'가 글로벌 인공지능(AI) 플랫폼 허깅페이스에서 데이터셋 부문 다운로드 1위를 기록했다고 28일 밝혔다.
네모트론 페르소나 코리아는 국가통계포털, 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버클라우드에 있는 한국인 관련 민관 데이터를 기반으로 합성됐다. 이름과 나이, 혼인 여부 같은 자세한 정보가 담겨있지만, 모두 통계에 기반해 생성된 가상 데이터여서 개인정보보호법을 위반하지는 않는다는 설명이다.
엔비디아가 밝힌 이 데이터셋의 목표는 한국의 자체 개발(소버린) AI가 학습할 수 있도록 편향되지 않은 데이터를 구축하는 데 있다. 오픈소스로 공개돼 국내외 개발자들이 자유롭게 쓸 수 있어, 사회과학 연구나 기업 소비자 분석에도 활용 가능하다. 엔비디아는 "기존 페르소나 데이터셋의 편향을 완화하는 게 주요 목표"라고 했다.
홍인택 기자 heute128@hankookilbo.com
Copyright © 한국일보. 무단전재 및 재배포 금지.
- 장동혁 "대통령 바꿨더니 나라가 졸지에 '범죄자 특혜' 공화국"-정치ㅣ한국일보
- '공천 배제' 김용 "제 희생이 민주당 승리의 마중물 되기를"-정치ㅣ한국일보
- 47세 한다감, 임신 발표 "연예계 최고령 산모 됐다"-문화ㅣ한국일보
- "기다렸던 고유가 지원금" 첫날 55만 명 신청… 신청률 1위는 전남-사회ㅣ한국일보
- 김문수, 부산 이어 대구·경북·강원 선대위원장 맡는다-정치ㅣ한국일보
- 조갑제 "'내란 재판' 추경호를 대구시장 후보에? 尹 지령 받았나"-정치ㅣ한국일보
- [단독] 김나희, 8월 결혼… 맥킨지 출신 사업가와 웨딩마치-문화ㅣ한국일보
- "사장네 집 쓰레기도 분리수거…노비 같았다" 영세 업체 노동자의 눈물-사회ㅣ한국일보
- "어린 놈이 무슨 시장"… 정이한 부산시장 후보, 유세 중 '음료 공격'에 실신-정치ㅣ한국일보
- 박성재 징역 20년 구형에 눈물 "국민께 충격 드려 죄송"-사회ㅣ한국일보