중국 모델 도용 의혹 정면 반박…업스테이지, 2000명 공개 검증으로 맞섰다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
업스테이지가 중국 모델을 도용했다는 논란에 대해 강력히 대응하겠다는 입장을 밝히고 전면 공개 검증을 실시했다.
이 논란은 지난 1일 고석현 사이오닉 AI 대표가 깃허브 리포트를 통해 업스테이지의 '솔라 오픈 100B' 모델이 중국 모델을 복사한 것이라는 대한 주장을 제기하며 시작됐다.
해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역으로, 오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표라는 게 업스테이지의 설명이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
모델 학습 로그와 체크포인트 등
개발 관련 주요 데이터 투명 공개
중국 모델 도용 주장에 “사과해야”
![김성훈 업스테이지 대표가 2일 강남오피스에서 업계 및 정부 관계자 70여 명을 대상으로 모델 검증 현장 설명을 하고 있다. [사진 = 업스테이지]](https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/02/mk/20260102182703580flrt.jpg)
이 논란은 지난 1일 고석현 사이오닉 AI 대표가 깃허브 리포트를 통해 업스테이지의 ‘솔라 오픈 100B’ 모델이 중국 모델을 복사한 것이라는 대한 주장을 제기하며 시작됐다.
고 대표는 솔라 100B가 중국 지푸AI의 ‘GLM-4.5-에어’ 모델의 신경망 구성 요소인 레이어놈과 96.8% 거의 일치한다고 주장했다.
그는 링크드인을 통해 “솔라 오픈이 GLM-4.5-에어 모델의 학습코드 대부분을 그대로 가져와서 사용한 건 사실로 판단된다”라며 “물론 인공지능(AI) 연구과정에서 이러한 접근 자체가 드문 일은 아니지만 이런 경우라면 처음부터 출처를 공개하는 게 보통이다”라고 했다.
이에 대해 김성훈 업스테이지 대표는 다음날인 2일 공개 검증을 위한 현장 설명회를 즉각 열었다. 2일 강남오피스에서 진행된 설명회에는 업계 및 정부 관계자 70여 명이 참석했으며, 온라인 생중계까지 포함하면 약 2000여명이 청취했다.
김 대표는 레이너놈 유사성을 근거로 타 모델의 가중치를 재사용했다는 주장은 통계적 착시에 불과하다고 설명했다. 해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역으로, 오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표라는 게 업스테이지의 설명이다.
김 대표는 “솔라, GLM, 파이(Pi)의 유사도를 측정했을 때도 높은 값이 나온다”라며 “다른 지표로 보면 솔라와 GLM-4.5-에어는 유사성이 낮다”라고 반박했다.
또한 레이어놈 유사성 판단에 사용된 ‘코사인 유사도’ 역시 적절한 비교 기준이 아니라고 강조했다. 코사인 유사도는 벡터의 방향만 비교하는 단순 지표로, 통상 언어모델들의 레이어놈은 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 값으로 나오는 것이 오히려 자연스러운 현상라는 것이다.
김 대표는 “프롬스크래치 여부를 판단할 수 있는 여부는 로스인데 로스가 높다는 건 처음에 학습이 안 됐다는 것을 의미한다”라며 “솔라 오픈은 초기 높은 로스로부터 학습됐다”라고 말했다.
또한 특정 모델의 소스코드를 가져와 라이선스를 조작했다는 의혹에 대해서도 사실과 다르다고 강조했다. 업스테이지는 더 많은 개발자들이 솔라 오픈을 쉽게 써볼 수 있도록 인퍼런스 코드를 공개했으며, 이 과정에서 서빙 호환성을 높이기 위해 허깅페이스의 공개 오픈소스 코드베이스 일부를 활용했다는 게 회사 설명이다.
업스테이지는 누구나 사용할 수 있는 ‘아파치 2.0’ 라이선스에 따라 통상적으로 사용되는 것으로, 해당 라이선스 출처를 정확히 표기하기 위해 문구를 업데이트한 것이라고 강조했다.
김 대표는 이같은 의혹을 제기한 고 대표에 대해 공개적으로 사과할 것을 촉구했다. 그는 “오류가 명확한 부분에 대해서는 공개 사과해 주시길 강력히 부탁드린다”고 했다.
이어 그는 “의견을 주고 받는 건강한 토론은 환영하나 이와 같은 허위 사실을 단정적으로 전달하는 행위는 AI 3강을 향해 최선을 다하고 있는 업스테이지와 정부 노력의 의미를 심각하게 훼손하는 것”이라고 했다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “월 50만·3년 부으면 최대 2200만원”…올해 나오는 ‘이 통장’ 비과세도 파격 - 매일경제
- “서둘러야 월 60만원씩 받는다”…2년 만에 재개된 정규직 전환 지원금 - 매일경제
- ‘신의 한수’로 버핏에게 2000억을 받아낸 남자…그의 투자전략이 궁금했다 [김유신의 딥 머니
- 중국 “미국 없이도 살 만한데?”…무역흑자 절반 ‘이 나라’서 나왔다 - 매일경제
- 금 온스당 5000달러간다?…금값과 달러로 본 2026년 투자 전망은 - 매일경제
- [속보]공군 T-50, 비상착륙때 활주로 이탈해 전복…조종사 2명 무사 - 매일경제
- 유명 여성 BJ, 약물 취해 운전…전봇대 들이받고 체포 - 매일경제
- “전광훈 목사 빼고 갈게요”…장위 10구역 17년만에 착공 승인, 사랑제일교회 제외 - 매일경제
- 강훈식 “캐나다 정부, 잠수함 수주 대가로 현대차 현지 공장 건설 요청” - 매일경제
- “사명감 가지고 준비하고 있다”…국제 경쟁력 잃었던 한국 야구, 2026 WBC 통해 부활할까 - MK스