오픈AI 한국인 엔지니어 “인간 50%만 대체해도 범용AI...하지만 지금 방식으론 도달 어렵다”

이병철 기자 2023. 8. 9. 18:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

"사람이 창출하는 경제적 효과의 50%를 대체할 수 있는 능력을 갖춘다면 범용인공지능(AGI)라고 볼 수 있습니다. 인공지능(AI)이 조종하는 로봇이 집안일을 절반 정도 처리할 수 있으면 기준을 충족한다고 볼 수 있는 겁니다. 이를 구체적으로 구현하려면 컴퓨터 비전의 역할이 중요합니다."

'거대 모델 시대에서 범용AI로 가기 위한 컴퓨터 비전의 역할과 발전 방향'을 주제로 마련된 이날 패널 토론에는 서울대 이경무 교수와 주한별 교수, 한국과학기술원(KAIST) 최윤재 교수, 한국과학기술연구원(KIST) 임화섭 인공지능연구단장도 참여했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

2023 한국컴퓨터비전학회토론회 열려
김종욱 오픈AI 기술스태프 등 국내 전문가 참여
현재 방식으로는 범용AI 달성 어려워
데이터 효율적 학습 방법 찾아야
김종욱 오픈AI 기술스태프가 이달 7일부터 9일까지 서울 강남 코엑스에서 열린 '한국 컴퓨터비전학회(KCCV) 2023'에 참석했다. 그는 9일 열린 패널 토론에 참가해 "컴퓨터 비전을 바탕으로 범용 인공지능을 달성하려면 효율적인 데이터 학습법의 개발이 필요하다"고 말했다./한국컴퓨터비전학회

“사람이 창출하는 경제적 효과의 50%를 대체할 수 있는 능력을 갖춘다면 범용인공지능(AGI)라고 볼 수 있습니다. 인공지능(AI)이 조종하는 로봇이 집안일을 절반 정도 처리할 수 있으면 기준을 충족한다고 볼 수 있는 겁니다. 이를 구체적으로 구현하려면 컴퓨터 비전의 역할이 중요합니다.”

김종욱 오픈AI 기술스태프는 9일 서울 강남 코엑스에서 열린 ‘한국컴퓨터비전학회(KCCV) 2023′ 패널 토론에 참석해 이같이 말했다.

김 스태프는 2009년 한국과학기술원(KAIST)을 졸업하고 미국 미시간대에서 컴퓨터과학·공학으로 석사, 뉴욕대에서 음악기술학으로 박사 학위를 받았다. NC소프트, 카카오와 미국 음악 스트리밍 기업 스포티파이를 거쳐 2019년 오픈AI에 합류했다. 오픈AI가 개발한 문자, 이미지 학습 신경망 ‘클립(CLIP)’과 음성 인식 신경망 ‘위스퍼(Whisper)’ 개발에 참여했다.

범용AI는 특정 문제뿐 아니라 주어진 모든 상황에서 생각할 수 있는 능력을 갖춘 AI를 말한다. 마치 사람처럼 주어진 모든 문제에 대응할 수 있는 능력을 갖춰 AI 연구의 최종 목표로 꼽힌다. 컴퓨터 비전은 사진과 영상에서 유의미한 정보를 추출해 컴퓨터가 처리할 수 있게 하는 기술이다. 컴퓨터 비전 기술이 발전하면 자율주행차, 로봇, 실시간 안전사고 감시가 가능해질 것으로 기대를 모은다.

김 스태프는 “최근 컴퓨터 비전 기술이 발달하면서 성능을 크게 끌어올렸다”며 “다만 실생활에 쓰이는 로봇이나 자율주행에 적용하기는 약간 부족한 상황”이라고 말했다.

최근에는 비교적 성능은 떨어지더라도 영상과 언어를 결합한 AI 모델이 속속 등장하고 있다. 오픈AI가 개발한 달리(Dall-E)가 대표적이다. 달리는 사용자가 입력한 내용에 맞춰 필요한 그림을 그려준다. 언어와 영상에 관련된 문제에 모두 대응할 수 있어 가장 기초적인 범용AI 모델로 평가받는다.

김 스태프는 “동시에 여러 기능을 하는 AI 모델은 하나의 기능만 수행하는 모델에 비해 절대적인 성능이 떨어진다는 문제가 있다”며 “다만 창의성 측면에서는 기존에 인간을 뛰어넘지 못한다는 편견을 깰 정도로 좋은 성능을 보여주는 만큼 가능성이 크다”고 말했다.

전문가들은 범용AI의 성능을 높이기 위해서는 기존의 방법으로는 어렵다고 보고 있다. 생성형 AI인 챗GPT는 대량의 데이터를 학습해 1750억개의 매개변수(파라미터)를 바탕으로 성능을 끌어 올렸다. 다만 데이터의 용량이 언어보다 100~1000배 이상 큰 영상은 동시에 많은 양을 학습하기는 어려운 상황이다.

김 스태프는 “챗GPT는 언어 분야에서는 범용AI에 가장 가까이 다가간 모델로 평가받는다”며 “언어는 데이터 용량이 작아 거대모델 구현이 쉽지만, 컴퓨터비전은 용량도 크고 숨겨진 메시지들이 많아 범용AI 달성을 위해서는 새로운 학습 방법의 개발이 필요하다”고 강조했다.

‘거대 모델 시대에서 범용AI로 가기 위한 컴퓨터 비전의 역할과 발전 방향’을 주제로 마련된 이날 패널 토론에는 서울대 이경무 교수와 주한별 교수, 한국과학기술원(KAIST) 최윤재 교수, 한국과학기술연구원(KIST) 임화섭 인공지능연구단장도 참여했다.

국내 전문가들도 김 스태프의 의견에 동의했다. 이경무 교수는 “범용AI를 달성하기 위해서는 데이터 학습의 패러다임을 바꿔야 한다”며 “단순히 기능을 높이기 위한 것보다는 실생활과 밀접한 데이터를 수집하고 이를 학습하는 연구가 이뤄져야 한다”고 말했다.

임화섭 단장은 “최근에는 인간의 뇌 학습 구조를 모방한 반도체칩도 개발돼 학습에 필요한 전력 소비를 줄이는 등 새로운 방법들이 제시되고 있다”며 “단순히 영상 데이터만 학습하는 것이 아니라 물리법칙을 동시에 학습해 실제 자연현상을 해석할 수 있게 하는 것도 새로운 방법이 될 것”이라고 말했다.

- Copyright ⓒ 조선비즈 & Chosun.com -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?