폐쇄형서 개방형으로…생성형 AI 무서운 진화 [인포로 본 세상]
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
2022년 11월 오픈AI가 챗GPT를 세상에 내놨으니, 생성형 AI가 붐을 일으킨 지도 2년이 흘렀다.
생성형 AI는 과연 어디까지 진화했을까.
오픈AI의 챗GPT와 구글의 '제미나이'가 대표적인데, 이 둘은 어떤 경쟁력을 가지고 있을까.
오픈AI는 o1을 두고 "외부 전문 테스터의 평가에서 o1은 더욱 신뢰할 수 있는 응답을 생성했다는 평가를 받았다"며 "전작에 비해 더 나은 성과를 보였는데 특히 코딩 문제에선 오류가 75% 감소했다"고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
인포그래픽으로 본 세상
그간 폐쇄형 AI 모델이 주류
오픈소스 AI 빠르게 따라잡아
대표적인 예로 딥시크 있어
시장 주도권 오픈소스가 잡아
한눈으로 살펴보는 AI 진화론
![AI 개발사들이 오픈소스 모델을 통해 자사 AI의 성능을 빠르게 끌어올리고 있다.[사진|연합뉴스]](https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/10/thescoop1/20250210202727926nxpr.jpg)
2022년 11월 오픈AI가 챗GPT를 세상에 내놨으니, 생성형 AI가 붐을 일으킨 지도 2년이 흘렀다. 생성형 AI는 과연 어디까지 진화했을까.[※참고: 생성형 AI는 기존 데이터를 학습해 새로운 텍스트·이미지·음악 등 콘텐츠를 만드는 AI 기술을 일컫는다.]
생성형 AI의 흐름은 2023년을 분기점으로 두개로 나뉘어 있다. 2023년까지 이어진 폐쇄형과 2023년부터 유행을 끈 오픈소스(개방형)다. 최근 시장에 반향을 불러일으킨 딥시크의 AI가 바로 오픈소스 모델이다(표❶).
딥시크 혁신을 통해 AI 진화론을 따라가보자. 지금까지 AI 기술은 (AI의) 작동 방식을 외부에 공개하지 않는 폐쇄형 모델이 이끌어왔다(표❷). 폐쇄형 모델은 중요한 정보나 기술을 자사만 보유하고 있어서 시장경쟁력이 높다. 오픈AI의 챗GPT와 구글의 '제미나이'가 대표적인데, 이 둘은 어떤 경쟁력을 가지고 있을까.
지난해 12월에 출시한 챗GPT의 최신 모델 'o1'을 살펴보자. o1은 높은 수준의 추론을 요구하는 과학·수학·코딩 문제를 해결한다. 오픈AI에 따르면 o1은 AI 벤치마크 테스트에서 'AIME 2024(수학)'는 78.0%, '코드포스(코딩)' 89.0%, 'GPQA 다이아몬드(박사 수준 과학 문제)' 76.0%의 정확도를 기록했다.
오픈AI는 o1을 두고 "외부 전문 테스터의 평가에서 o1은 더욱 신뢰할 수 있는 응답을 생성했다는 평가를 받았다"며 "전작에 비해 더 나은 성과를 보였는데 특히 코딩 문제에선 오류가 75% 감소했다"고 말했다.
챗GPT가 처음 출시된 지 4개월이 흐른 후 구글이 제미나이를 내놓았다. 제미나이는 번역과 같은 언어 표현 성능이 우수하다는 평가를 받는다. 상위 모델인 '제미나이 1.0 울트라'는 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다. 이는 인간 전문가 점수인 89.8%를 넘는 수준이었다(표❸).
이런 와중에 AI 후발주자들이 '오픈소스 모델'을 앞세워 빠르게 성능을 끌어올리고 있다. 오픈소스 모델은 AI의 개발 정보를 대중에게 공개한 거다. 많은 사람들이 이용해볼 수 있는 만큼 기능 개선이 빠르고 생태계 확장에 용이하단 장점이 있다. '메타' '앤스로픽' '딥시크'가 오픈소스 AI 모델을 개발하고 있다.
메타는 최신 모델 '라마 3(2024년 4월 공개)'을 운영하고 있는데, 라마 3은 MMLU에서 정답률 88.6%를 기록해 GPT-4o(88.7%)를 턱밑까지 추격하는 데 성공했다.[※참고: GPT-4o는 o1의 직전 모델로 2024년 5월 공개됐다.] 비영어권 언어에서의 성능도 영어와 비슷한 수준으로 올렸다는 평을 받았다.
![[일러스트 | 게티이미지뱅크]](https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/10/thescoop1/20250210202729565zufo.jpg)
앤스로픽의 '클로드 V3' 모델은 작문과 언어 면에서 뛰어난 성능을 보인다. 한문, 고대 그리스어, 고대 영어를 지원한다는 점이 특징이다. 앤스로픽에 따르면 가장 고성능 모델인 '오푸스'는 벤치마크에서 GPT-4(2023년 3월 공개)를 비롯한 당시 경쟁사들의 최신 모델보다 앞선 성능을 보였다. 멘사 IQ 테스트에선 최초로 IQ 100을 넘겼다(표❹).
딥시크는 단기간에 성능을 챗GPT 수준으로 크게 올려 AI 시장에서 큰 주목을 받았다. 지난 1월 세상에 내놓은 '딥시크-R1'는 고사양 AI 칩 없이 o1보다 좋은 성과를 냈다. 특히 GPT의 가장 큰 장점인 코딩 분야에도 o1을 0.3%포인트 차이로 거의 따라잡았다(표❺).
업계는 AI 주도권이 이젠 오픈소스 모델로 향하고 있다고 평가하고 있다. 딥시크가 등장한 AI 시장은 앞으로 어떻게 흐를까.
조서영 더스쿠프 기자
syvho11@thescoop.co.kr
Copyright © 더스쿠프. 무단전재 및 재배포 금지.