건국대 "텍스트 입력만으로 영상 분할·편집하는 기술 개발"
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
건국대는 공과대학 김원준 교수 연구팀이 '고성능 개방형 어휘 3차원 영상 분할 알고리즘'을 개발했다고 8일 밝혔다.
연구팀은 텍스트 입력만으로 3차원 영상 내에서 사용자가 원하는 객체를 정밀하게 분할하고 편집할 수 있는 개방형 어휘(Open-vocabulary) 기반의 3차원 영상 분할 기술을 구현했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
"3D 콘텐츠 생성, 3차원 장면 이해, 이머시브 서비스 분야 등에서 활용 기대"

[서울=뉴시스]전수현 인턴 기자 = 건국대는 공과대학 김원준 교수 연구팀이 '고성능 개방형 어휘 3차원 영상 분할 알고리즘'을 개발했다고 8일 밝혔다.
이번 연구 결과는 컴퓨터 비전 및 인공지능 분야 세계 최고 권위 학술대회 중 하나인 국제 컴퓨터 비전학회(IEEE/CVF International Conference on Computer Vision, ICCV 2025)에서 발표될 예정이다.
연구팀은 텍스트 입력만으로 3차원 영상 내에서 사용자가 원하는 객체를 정밀하게 분할하고 편집할 수 있는 개방형 어휘(Open-vocabulary) 기반의 3차원 영상 분할 기술을 구현했다.
이번 연구는 서로 다른 시점에 존재하는 객체에 대한 언어 임베딩(Language Embedding)의 일관성을 유지하면서, 새로운 시점의 이미지를 생성할 수 있도록 했다.
언어 임베딩과 가우시안 스플래팅(Gaussian Splatting) 파라미터를 동시에 학습하는 전략을 새롭게 제안한 것이 핵심이다. 또한 대조적 학습(Contrastive Learning) 기법을 접목해 새로운 시점 이미지 내 객체 검출 성능을 크게 향상했다.

이를 통해 정밀한 3차원 장면 렌더링은 물론 생성된 이미지상에서 텍스트 명령어를 기반으로 사용자 지정 객체 분할 및 편집이 가능해졌다.
한편 이번 논문의 제1저자는 건국대 장성민 석사과정생이며, 교신저자는 김 교수다. 본 연구는 과학기술정보통신부의 연구비 지원을 받아 수행됐다.
☞공감언론 뉴시스 soooo@newsis.com
Copyright © 뉴시스. 무단전재 및 재배포 금지.
- 홍지민, 술집 알바 중 성추행 당했다
- '200억 탈세 의혹' 차은우, 국방부도 손절했다
- 황영웅, 3년 만에 학폭 의혹 부인…"허위 사실 방치할 수 없어"
- 게임 중독 고백 이민정 "현질 많이 해…하면 1등 해야"
- "너도 연락했잖아" 배지현 폭로에 황재균 당황…류현진 "뭐라고?"
- 이하이, 5년 넘게 1인 기획사 미등록 운영…"무지·불찰 탓"
- 민희진 측, '뉴진스 탬퍼링 의혹' 기자회견 연다
- '이범수와 파경' 이윤진, 훌쩍 큰 자녀와 서울시의회 표창
- 아내가 아들의 야구 코치와 불륜…"유명 프로야구 선수 출신"
- "이강인 여친 자격으로?"…PSG 여자친구 모임에 등장한 두산家 5세