인텔리빅스, 중앙대 손잡고 이미지 텍스트화 LMM 연구

이동인 기자(moveman@mk.co.kr) 2024. 4. 17. 19:48
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

AI 전문기업 인텔리빅스는 중앙대학교 거대멀티모달모델(LMM-Large Multimodal model) 공동 연구를 위한 협약을 체결했다고 밝혔다.

최은수 인텔리빅스 대표와 박상규 중앙대학교 총장은 중앙대학교 총장실에서 이미지에 대한 설명을 텍스트로 생성하는 LMM 개발을 위한 협약(MOU)을 체결하고 CCTV에 찍힌 안전 관련 영상분석 이벤트를 텍스트 데이터로 전환해주는 멀티모달AI(Multimodal AI)를 공동 개발한다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

17일 협약 공동연구 추진

AI 전문기업 인텔리빅스는 중앙대학교 거대멀티모달모델(LMM-Large Multimodal model) 공동 연구를 위한 협약을 체결했다고 밝혔다.

최은수 인텔리빅스 대표와 박상규 중앙대학교 총장은 중앙대학교 총장실에서 이미지에 대한 설명을 텍스트로 생성하는 LMM 개발을 위한 협약(MOU)을 체결하고 CCTV에 찍힌 안전 관련 영상분석 이벤트를 텍스트 데이터로 전환해주는 멀티모달AI(Multimodal AI)를 공동 개발한다.

인텔리빅스 로고. 인텔리빅스
인텔리빅스는 이 멀티모달AI를 활용해 지능형 CCTV에 찍힌 모든 영상을 데이터로 전환해 언제, 어디에서 어떤 재난재해가 발생했는지에 대한 빅데이터를 만들고 LLM(초거대 언어모델)을 활용해 관제일지를 자동으로 작성하고 통계를 분석해 ‘예방안전’활동을 할 수 있도록 할 방침이다.

이를 위해 인텔리빅스와 중앙대는 거대언어모델을 기반으로 사전 훈련된 비전 인코더와 연계해 이미지에 대한 설명을 텍스트로 생성하는 비전-언어 경량화 모델을 만들어 상용화할 계획이다.

나아가 영상(이미지) 데이터와 언어모델을 결합해 향후 이미지에 대한 질의 응답 및 추론 등을 통해 도시 안전은 물론 산업안전, 생활 안전, 교통안전, 재난재해 특성에 대한 시사점을 도출해 사고예방을 위한 대책마련에 도움을 줄 수 있도록 할 방침이다.

이번 협약을 통해 양 기관은 LMM 공동 연구는 물론 중앙대학교 학생들의 인턴십 제공, 채용 등의 다양한 기회 제공을 통해 산학협력의 모델을 만들어 나갈 계획이다.

인텔리빅스는 독자 개발한 영상 AI 기술을 토대로 국내 200개 이상의 지방자치단체, 공공기관, 민간 기업 등에 안전관련 AI 솔루션을 공급하고 있다. 특히 국내 최초로 한국인터넷진흥원(KISA)에서 1호 지능형CCTV 인증을 받은 바 있다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?