김동환 대표 "멀티모달 학습 데이터 불충분…구축·개방을"

김보경 2024. 5. 28. 15:10
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

김동환 포티투마루 대표는 28일 "멀티모달 학습 데이터에 대한 투자가 많이 이뤄져야 한다"고 말했다.

김 대표는 이날 서울 중구에서 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 개최한 '데이터 중심 AI 가속화 밋업' 행사의 기조연설에 나서 이같이 말했다.

김 대표는 "내년까지는 멀티모달 기술 고도화와 데이터 학습에 대한 경쟁이 치열해질 것"이라며 "국내에는 멀티모달을 위한 학습 데이터가 충분하지 않다"고 진단했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과기정통부-NIA 밋업 행사

김동환 포티투마루 대표는 28일 "멀티모달 학습 데이터에 대한 투자가 많이 이뤄져야 한다"고 말했다.

김동환 포티투마루 대표/ 사진=김현민 기자 kimhyun81@

김 대표는 이날 서울 중구에서 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 개최한 '데이터 중심 AI 가속화 밋업' 행사의 기조연설에 나서 이같이 말했다.

그는 오픈AI가 개발한 소라(Sora)와 GPT-4o처럼 텍스트뿐만 아니라 음성, 이미지, 동영상까지 결합한 멀티모달(Multi-modal) 기술에 대해 소개했다.

김 대표는 "내년까지는 멀티모달 기술 고도화와 데이터 학습에 대한 경쟁이 치열해질 것"이라며 "국내에는 멀티모달을 위한 학습 데이터가 충분하지 않다"고 진단했다.

이어 "공개된 데이터가 별로 없어 기업들이 손을 못 대고 있는 경우가 많다"고 업계 상황을 전했다. 그는 AI 모델이 제대로 작동하려면 데이터의 전처리 과정도 중요하다고 말했다. 그러면서 "때로는 데이터를 정리하고 정비하는 작업에 더 많은 시간과 비용이 들기도 한다"고 했다.

그는 "현재의 초거대 AI 접근 방식은 대용량의 데이터 학습을 수반하는 경우가 많다"면서 "데이터 구축과 개방이 필요하고, 인프라 투자가 적극적으로 이뤄져야 한다"고 재차 강조했다.

아울러 조선·해양, 자동차 정비, 자금세탁 수사 등의 분야 업무는 경험과 노하우가 많은 '베테랑'에게 맡겼다면 이제는 AI가 그의 업무를 일부 대신하고 있다고 설명했다.

김 대표는 "조선·해양 분야에서 LNG 선박 설계도를 만들 때 50여명의 엔지니어가 투입되고 10개월~1년 정도 기간이 소요된다"며 "2~3년 안에 AI가 일주일 내에 만들어줄 수 있는 수준으로 발전할 것"이라고 내다봤다.

김보경 기자 bkly477@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?