연세대, GPT 대체할 ‘디퓨전 언어모델’ 연구…AI 최고 권위 학회 등재
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
연세대학교는 인공지능융합대학 서영빈 연구원이 제1 저자로 제출한 논문이 세계 최고 권위의 머신러닝 학회인 뉴립스(NeurIPS)에서 스포트라이트(Spotlight) 등급에 채택됐다고 26일 밝혔다.
서 연구원은 "디퓨전 언어모델의 장점인 빠른 속도와 양방향 주의는 강화학습에서도 중요한 특성"이라며, "이러한 장점 덕분에 기존 자가 회귀 패러다임을 대체할 가능성이 있다고 보고 연구를 시작했다"고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

(서울=뉴스1) 송송이 기자 = 연세대학교는 인공지능융합대학 서영빈 연구원이 제1 저자로 제출한 논문이 세계 최고 권위의 머신러닝 학회인 뉴립스(NeurIPS)에서 스포트라이트(Spotlight) 등급에 채택됐다고 26일 밝혔다.
스포트라이트 등급은 전체 제출작 중 상위 약 3%에게 주어지는 등급이다. 이번 성과는 국내 연구 기관이 주도한 디퓨전 언어모델 연구가 국제적으로 검증받은 최초 사례다.
이번 논문은 '디퓨전' 패러다임을 언어 생성에 적용한 것이다.
디퓨전 언어모델은 챗 GPT와 같은 자가 회귀 언어모델이 1000단어를 생성하기 위해 1000단계를 거쳐야 하는 것과 달리 100단계 만에 결과를 낼 수 있는 것이 특징이다.
연구팀은 “사람 머릿속에서 생각이 한 번에 ‘반짝’ 떠오르는 것과 유사한 방식으로 빠르고 유창한 생성이 가능하다"고 설명했다.
논문에는 불안정성을 줄이는 방법도 제시됐다. 디퓨전 언어모델은 한 번에 여러 단어를 생성할 수 있는 장점이 있지만, 긴 글에서는 문법 오류나 문맥의 불연속성이 발생하기 쉽다. 이를 해결하기 위해 컨볼루션 디코딩과 R2FT라는 두 가지 기법을 도입했다. 그 결과 기존 언어모델보다 3배 이상 빠른 속도를 내면서도 문법적 안정성과 질문 응답 성능을 유지했다.
서 연구원은 "디퓨전 언어모델의 장점인 빠른 속도와 양방향 주의는 강화학습에서도 중요한 특성”이라며, “이러한 장점 덕분에 기존 자가 회귀 패러다임을 대체할 가능성이 있다고 보고 연구를 시작했다”고 말했다.
이번 연구는 여진영·김재형·이동하 연세대 인공지능학과 교수와의 협력으로 진행됐다. 여진영 교수는 “이번 성과는 기존 언어모델을 대체할 수 있는 핵심 기술로서 디퓨전 언어모델의 잠재력을 한 단계 끌어올렸다”며, “최근 ChatGPT와 같은 챗봇 서비스에서도 오랜 시간 생각을 거쳐 답변을 시작하는 방식이 보편화되고 있기 때문에 생성 속도를 비약적으로 끌어올릴 수 있는 디퓨전 언어모델은 산업적으로 잠재성이 높다"고 말했다.
뉴립스 학회는 12월 2~7일 미국 샌디에이고 컨벤션센터에서 열린다.
mark834@news1.kr
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- 성폭행 피해 여성 "경찰이 성관계해 주면 사건 접수해 주겠다" 폭로 발칵
- '모텔 살인' 김소영 "엄마 밥 먹고 싶다, 무기징역 받을까 무섭다"
- "뒤에서 날 끌어안은 미모의 동료 여직원"…구청 공무원, 합성 프사 말썽
- "윤석열 반찬 투정에 식탐" 내부 폭로 나왔다…류혁 전 감찰관 "맞다"
- 천년 된 전통 음식이라는데 '아동 소변'으로 삶은 달걀 커피 판매 논란
- "'온몸 구더기' 아내, 오래된 골절…부사관 남편은 큰 빚 있었다"
- 여직원 책상에 'XX털' 뿌린 상사…'안 죽었니?' 택시 기사 폭행한 버스 기사[주간HIT영상]
- 김대희, 승무원 출신 아내 공개 "26살에 결혼…파혼할 뻔한 적도 있어"
- 나나 "꾸준히 잘 만나, 이상형은 부드러운 사람"…연하 채종석과 열애설 재점화
- 최준희, 5월 결혼 앞두고 더 물오른 미모…시크 비주얼 [N샷]