인피닉, 퓨샷 객체 감지 연구로 SCI(E)급 국제학술지에 논문 게재
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인피닉은 '이미지-언어 유사성을 활용한 퓨샷(Few-shot) 객체 감지' 연구 논문이 SCI(E)급 국제 학술지 '컴퓨터 비전과 이미지 이해'에 게재됐다고 28일 밝혔다.
인피닉 인공지능 연구소에서 발표한 이번 논문은 이미지와 언어의 유사성을 활용해 30장 이내 적은 양의 이미지 데이터에서 객체 위치와 클래스를 검출해 객체 감지의 정확성을 높이는 모델(RISF)의 연구 결과다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
인피닉은 ‘이미지-언어 유사성을 활용한 퓨샷(Few-shot) 객체 감지’ 연구 논문이 SCI(E)급 국제 학술지 ‘컴퓨터 비전과 이미지 이해’에 게재됐다고 28일 밝혔다.
인피닉 인공지능 연구소에서 발표한 이번 논문은 이미지와 언어의 유사성을 활용해 30장 이내 적은 양의 이미지 데이터에서 객체 위치와 클래스를 검출해 객체 감지의 정확성을 높이는 모델(RISF)의 연구 결과다.
RISF 모델은 이미지 내 객체의 위치와 클래스 정보를 검출하는 모델과 이미지-텍스트 간 유사도를 사전 학습한 CLIP 모델을 결합했다. 특히 BNRL이라는 새로운 손실 함수를 만들어 모델 결합 시 발생할 수 있는 오류를 최소화하는 방법을 추가해 정확도를 높였다.
또한 RISF 모델은 글로벌 머신러닝 학술 사이트인 ‘페이퍼 위드 코드’에서 퓨샷 객체 감지 부분에서 AP 지표 25.5를 기록하며 전 세계 2위에 올랐다. 페이퍼 위드 코드는 전 세계 AI 연구자들이 자신의 인공지능 연구 모델과 논문을 공유하는 글로벌 커뮤니티다.
인피닉의 연구 논문이 게재된 국제 학술지 ‘컴퓨터 비전과 이미지 이해’는 컴퓨터 비전과 이미지 처리, 패턴 인식 등 비정형 데이터 분야의 다양한 주제를 다룬다. SCI(E)급 학술지로 국제적으로 고품질의 연구를 게재하고 국제적인 연구자들 사이에서 폭넓은 인지도를 갖고 있다.
이번 논문 발표를 주도한 정민재 연구원은 “RISF 모델은 객체 감지 단계에서 기존의 접근 방식보다 훨씬 뛰어난 성능을 보여준다”며 “특히 적은 양의 비전 데이터 만으로 물체 감지하는데 뛰어난 성능과 정확도를 나타내기 때문에 인공지능 학습 단계에서 유용하고 효과적인 모델이 될 수 있다”고 설명했다.
인피닉 박준형 대표이사는 “RISF 모델은 글로벌 커뮤니티 페이퍼 위드 코드 2위뿐만 아니라 SCI급 학술지에 실리며 세계적으로 인정을 받았다”며 “향후에도 인공지능 분야의 지속적인 연구 개발을 이어 나갈 것”이라고 말했다.
solidkjy@fnnews.com 구자윤 기자
Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.
- 버닝썬 피해자 "웃는 사진 찍으면 보내주겠다 협박했다"
- 배우 이상아, 사무실 무단 침입 피해에 경찰 신고
- 박명수 "사우나서 다 벗고 있는데 송중기가 인사하더라"
- 함소원 "내 학력 위조 사건은 500만원 때문"
- 女모델 혼자 사는 원룸에 도청장치 발견돼…범인 정체는?
- '승리·정준영·최종훈' 추가 만행 공개..故 구하라가 결정적 역할했다
- "직장 부하 20대 여성과 불륜…시어머니 쓰러져" [어떻게 생각하세요]
- "낮부터 세차례 음주"..김호중, 음주 뺑소니 열흘만에 '음주운전' 인정
- 민희진 "룸살롱·텐프로 들락대는 것도 감사했나" 비난
- 제주행 비행기 앞좌석에 발올린 30대 섹시女.."승무원도 제지 못했다" [어떻게 생각하세요]