[이문태의 마켓 나우] 알아서 진화하는 생성형 AI의 경쟁력
정보기술(IT) 플랫폼 업계에서 이용자 수는 서비스에 대한 관심도와 회사의 미래 기술력에 대한 고객의 기대를 반영한다. 그래서 이용자 수는 향후 수익을 예측하는 지표로 활용된다. 넷플릭스는 100만 명의 이용자를 확보하기까지 약 3년 반이 소요됐다. 트위터는 2년, 페이스북은 10개월, 인스타그램도 2.5개월이 걸렸다.
생성형 AI를 대표하는 언어모델 서비스를 제공한 챗GPT는 2022년 발표 단 5일 만에 100만 이용자를 확보하며 IT 역사의 한 페이지를 장식했다. 생성형 AI의 파격은 무엇이고 경쟁력 확보를 위한 최신 글로벌 기술 트렌드는 어떻게 변화하고 있을까.
생성형 AI는 하나의 ‘거대모델’이다. 여러 태스크(작업·과제)를 높은 성능으로 해결하는 ‘다재다능함(versatility)’이 기본이다.
2010년대 딥러닝 기술은 데이터 기반으로 인공지능을 만드는 기계학습의 주류 방법론으로 부상하며 사물 인식이나 언어 번역 등의 개별 태스크 성능을 비약적으로 높였다. 사람 수준에 가깝거나 이를 뛰어넘는 혁신을 보였지만, 수천 개의 태스크를 위해 개별적인 AI 모델을 만들어야 하는 어려움이 있었다. 생성형 AI는 모델 크기가 커짐에 따라 여러 태스크의 성능도 함께 높아지는 확장성(scalability)과 작은 모델로는 해결하지 못했던 고난도 태스크에서 갑자기 높은 성능을 선보이는 창발성(創發性)을 보여주며 AI의 신흥 패러다임으로 자리매김했다.
2022년에는 선도 업체들이 AI 모델의 ‘파라미터’ 크기를 더욱 키우며 초거대 AI를 만들었다면, 2023년 업계의 큰 트렌드는 ‘데이터’다. 많은 연산자원을 사용하며 무작정 대형 모델을 만들기보단, 좀 더 작은 모델에 양질의 데이터로 학습을 진행해 보니 대형 모델과 흡사하거나 나은 성능을 보이기 시작한 것이다.
이제 화두는 빅데이터 시절에 강조하던 데이터의 중요성과는 다르다. 컴퓨터 코딩을 자동화해 주는 위저드코더(WizardCoder)는 챗GPT가 ‘생성’한 프로그래밍 코드를 학습해 최첨단(State-Of-The-Art, SOTA) 성능을 갱신했다. 여기에 자기수정(self-correct) 기술을 활용해 한 차례 생성한 내용을 다시 초거대 언어모델을 통해 ‘평가’해 양질의 데이터로 개선한 후 다시 학습하는 방법론을 제시한다. 즉 생성형 AI를 통해 더 높은 퀄러티의 데이터까지 대량으로 ‘생성’ 가능한 만큼 고성능의 생성형 AI, 특히 트렌드의 핵심인 초거대 언어모델의 중요성이 한 층 더 심화할 전망이다.
자가발전이 가능한 생성형 AI 시대에 어떻게 경쟁력을 확보할지 산업계·학계·정부 모두 부단히 노력할 시점이다.
이문태 LG AI연구원 어드밴스트 ML 랩장
Copyright © 중앙일보. 무단전재 및 재배포 금지.
- 왜 한국을 중국 일부라 했나…이제야 드러났다, 시진핑 속내 | 중앙일보
- 고교생 딸 친구 26번 성폭행…통학차 기사, 2심서도 "난 무죄" | 중앙일보
- 조개구이는 옛말…모든 객실이 스위트룸, 승마도 즐기는 그 섬 | 중앙일보
- 용산 상공 400m서 핵폭발?…김정은 '최대 살상고도' 찾고있다 | 중앙일보
- 엑소 디오 코에서 연기 딱걸렸네…대기실서 흡연, 과태료 낸다 | 중앙일보
- "비싸서 안 가""무조건 해외로"…황금연휴에도 내수는 빨간불 | 중앙일보
- 김정은 딸 김주애 표정, 밝았다 어두워져…통일부 분석 보니 | 중앙일보
- 美서 '징역 100년' 서씨 사연 어떻길래…특별사면 여부 주목 | 중앙일보
- [단독] "쉿! 유출 안돼" 삼성, 반도체 개발에 '네이버 AI' 쓴다 | 팩플 | 중앙일보
- 문신 드러낸 채 직원 위협…'하얏트호텔 난동' 수노아파 자백 | 중앙일보