이미지 알아보고 언어 유창해진 AI… IT기업 선점 경쟁 [진화하는 챗GPT]
냉장고 식재료 보고 레시피 척척
사진 인식해 답변 ‘멀티모달’ 기능
네이버·SKT 등 상반기 장착 예정
단어구사능력 8배·기억력 10배↑
MS·모건스탠리 등 발빠른 채택
국내선 카톡채널 ‘아숙업’ 첫 장착
AI 프리토킹 등 학습앱 활용도
19일 업계에 따르면 GPT-4는 GPT-3.5와 비교해 훨씬 똑똑해졌다. 가장 큰 차별점은 이미지를 인식한다는 것이다. 예를 들어 딸기, 우유, 요구르트, 당근 등이 있는 냉장고 안 사진을 올리고 만들 수 있는 음식을 물으면 요구르트 파르페, 당근·후무스 랩 등을 제시하는 식이다. 이미지에서 이상한 점을 찾으라고 해도 정확하게 답을 준다.
외신은 그림이 포함된 물리나 수학 문제를 찍어 보여주면 문제를 풀 수 있을 것이란 전망도 내놓고 있다.
AI가 텍스트 외 이미지 등을 인식하는 기능을 ‘멀티모달’이라고 한다. 멀티모달은 네이버가 상반기 내놓는 ‘서치GPT’, SK텔레콤 ‘에이닷’ 등에도 장착될 예정이다. 이미지를 인식해 비슷한 이미지를 제시하는 식이다.
현재 GPT-4는 유료(월 20달러) 버전인 챗GPT 플러스에 가입하면 이용할 수 있다. 다만, 이미지 인식 기능은 아직 제공하지 않고 있다.
GPT-4 등장으로 IT업계는 어떻게 활용할지 발 빠르게 움직이고 있다.
해외에서는 마이크로소프트(MS)는 이미 검색엔진 ‘빙’에 GTP-4를 장착했다. 자산관리 및 투자전략 분석 등에 GPT-3를 이용하던 모건스탠리는 GPT-4로 변경했다. 언어 학습플랫폼 듀오링고는 영어테스트를 실행하는 프로그램에 GPT-4를 적용했다. 국내에서는 AI 스타트업 업스테이지는 카카오톡 채널 ‘아숙업(AskUp)’에 GPT-4를 장착했다. 아숙업은 업스테이지의 광학문자인식(OCR) 기술과 GPT-4를 결합해 개설된 카톡 채널이다. 아직 이미지 속 사물을 식별하지는 못하지만, 이미지에 포함된 문자는 이해한다. 종이에 ‘심심해’라고 적어 사진으로 찍어 올리고, ‘뭘 하면 좋을까’라고 입력하면 △새로운 취미나 스포츠를 시작해 보기 △가족이나 친구들과 함께 여행을 가거나 나들이를 하기 △책을 읽거나 영화를 보며 여유롭게 쉬기 등을 제안한다.
에듀테크 기업 스픽이지랩스는 영어 학습 앱 ‘스픽’의 ‘AI 튜터’를 GPT-4 기반으로 개선했다. AI 튜터는 AI가 상황·맥락·분위기 등을 파악해 실제 원어민과 같은 대화를 구사하며 자유자재로 프리토킹을 할 수 있는 서비스다.
앞서 많은 스타트업이 GPT-3.5나 GPT-3.5 터보 모델을 기반으로 서비스를 내놓은 만큼 조만간 고도화가 가능할 것으로 전망된다.
이진경 기자 ljin@segye.com
ⓒ 세계일보 & Segye.com, 무단 전재 및 재배포 금지