폐쇄형서 개방형으로…생성형 AI 무서운 진화 [인포로 본 세상]

더스쿠프’s infographic
인포그래픽으로 본 세상
그간 폐쇄형 AI 모델이 주류
오픈소스 AI 빠르게 따라잡아
대표적인 예로 딥시크 있어
시장 주도권 오픈소스가 잡아
한눈으로 살펴보는 AI 진화론

AI 개발사들이 오픈소스 모델을 통해 자사 AI의 성능을 빠르게 끌어올리고 있다.[사진｜연합뉴스]

2022년 11월 오픈AI가 챗GPT를 세상에 내놨으니, 생성형 AI가 붐을 일으킨 지도 2년이 흘렀다. 생성형 AI는 과연 어디까지 진화했을까.[※참고: 생성형 AI는 기존 데이터를 학습해 새로운 텍스트·이미지·음악 등 콘텐츠를 만드는 AI 기술을 일컫는다.]

생성형 AI의 흐름은 2023년을 분기점으로 두개로 나뉘어 있다. 2023년까지 이어진 폐쇄형과 2023년부터 유행을 끈 오픈소스(개방형)다. 최근 시장에 반향을 불러일으킨 딥시크의 AI가 바로 오픈소스 모델이다(표❶).

딥시크 혁신을 통해 AI 진화론을 따라가보자. 지금까지 AI 기술은 (AI의) 작동 방식을 외부에 공개하지 않는 폐쇄형 모델이 이끌어왔다(표❷). 폐쇄형 모델은 중요한 정보나 기술을 자사만 보유하고 있어서 시장경쟁력이 높다. 오픈AI의 챗GPT와 구글의 '제미나이'가 대표적인데, 이 둘은 어떤 경쟁력을 가지고 있을까.

지난해 12월에 출시한 챗GPT의 최신 모델 'o1'을 살펴보자. o1은 높은 수준의 추론을 요구하는 과학·수학·코딩 문제를 해결한다. 오픈AI에 따르면 o1은 AI 벤치마크 테스트에서 'AIME 2024(수학)'는 78.0%, '코드포스(코딩)' 89.0%, 'GPQA 다이아몬드(박사 수준 과학 문제)' 76.0%의 정확도를 기록했다.

오픈AI는 o1을 두고 "외부 전문 테스터의 평가에서 o1은 더욱 신뢰할 수 있는 응답을 생성했다는 평가를 받았다"며 "전작에 비해 더 나은 성과를 보였는데 특히 코딩 문제에선 오류가 75% 감소했다"고 말했다.

챗GPT가 처음 출시된 지 4개월이 흐른 후 구글이 제미나이를 내놓았다. 제미나이는 번역과 같은 언어 표현 성능이 우수하다는 평가를 받는다. 상위 모델인 '제미나이 1.0 울트라'는 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다. 이는 인간 전문가 점수인 89.8%를 넘는 수준이었다(표❸).

이런 와중에 AI 후발주자들이 '오픈소스 모델'을 앞세워 빠르게 성능을 끌어올리고 있다. 오픈소스 모델은 AI의 개발 정보를 대중에게 공개한 거다. 많은 사람들이 이용해볼 수 있는 만큼 기능 개선이 빠르고 생태계 확장에 용이하단 장점이 있다. '메타' '앤스로픽' '딥시크'가 오픈소스 AI 모델을 개발하고 있다.

메타는 최신 모델 '라마 3(2024년 4월 공개)'을 운영하고 있는데, 라마 3은 MMLU에서 정답률 88.6%를 기록해 GPT-4o(88.7%)를 턱밑까지 추격하는 데 성공했다.[※참고: GPT-4o는 o1의 직전 모델로 2024년 5월 공개됐다.] 비영어권 언어에서의 성능도 영어와 비슷한 수준으로 올렸다는 평을 받았다.

앤스로픽의 '클로드 V3' 모델은 작문과 언어 면에서 뛰어난 성능을 보인다. 한문, 고대 그리스어, 고대 영어를 지원한다는 점이 특징이다. 앤스로픽에 따르면 가장 고성능 모델인 '오푸스'는 벤치마크에서 GPT-4(2023년 3월 공개)를 비롯한 당시 경쟁사들의 최신 모델보다 앞선 성능을 보였다. 멘사 IQ 테스트에선 최초로 IQ 100을 넘겼다(표❹).

딥시크는 단기간에 성능을 챗GPT 수준으로 크게 올려 AI 시장에서 큰 주목을 받았다. 지난 1월 세상에 내놓은 '딥시크-R1'는 고사양 AI 칩 없이 o1보다 좋은 성과를 냈다. 특히 GPT의 가장 큰 장점인 코딩 분야에도 o1을 0.3%포인트 차이로 거의 따라잡았다(표❺).

업계는 AI 주도권이 이젠 오픈소스 모델로 향하고 있다고 평가하고 있다. 딥시크가 등장한 AI 시장은 앞으로 어떻게 흐를까.

조서영 더스쿠프 기자
syvho11@thescoop.co.kr

경제

폐쇄형서 개방형으로…생성형 AI 무서운 진화 [인포로 본 세상]