쏘카, 국제 딥러닝 컨퍼런스서 연구 성과 발표… 효율적 데이터 학습 사례 소개

김창성 기자 2023. 5. 2. 17:46
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

쏘카가 딥러닝 분야 세계 최고 권위의 컨퍼런스인 'ICLR(International Conference on Learning Representations) 2023' 워크숍에서 관련 연구 성과를 발표한다.

2일 쏘카에 따르면 오는 5일 ICLR에서 운영하는 워크숍 PML4DC(Practical Machine Learning for Developing Countries)에 참석해 딥러닝 연구 논문을 발표한다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

쏘카 AI팀(왼쪽부터 원혜진 매니저, 박경호 팀장, 김현수 매니저)이 딥러닝 분야 세계 최고 권위의 컨퍼런스인 'ICLR 2023' 워크숍에서 관련 연구 성과를 발표한다. /사진=쏘카
쏘카가 딥러닝 분야 세계 최고 권위의 컨퍼런스인 'ICLR(International Conference on Learning Representations) 2023' 워크숍에서 관련 연구 성과를 발표한다.

2일 쏘카에 따르면 오는 5일 ICLR에서 운영하는 워크숍 PML4DC(Practical Machine Learning for Developing Countries)에 참석해 딥러닝 연구 논문을 발표한다.

쏘카는 데이터 리소스가 부족한 환경에서 효율적으로 데이터를 학습시킬 수 있는 사례를 소개한다.

쏘카 인공지능(AI)팀은 '공개 의도 분류에 대한 보정 효과 분석'에 대한 논문을 발표한다. 논문에서는 딥러닝 모델이 실제값과 예측값의 차이를 계산하는 크로스 엔트로피 손실로 데이터를 학습할 경우 생기는 손실값에 보정을 추가하는 방법을 제안한다.

문장 분류 문제에서 기존 학습 데이터에 포함되지 않은 카테고리 문장이 주어지는 상황 속 딥러닝 모델이 이를 별도의 OOD(out-of-distribution)의 라벨로 분류하는 방법과 데이터셋이 적은 환경에서 문장 분류 문제를 효과적으로 풀어낸 수 있는 방법도 담았다.

두번째 논문에서는 '텍스트 데이터 증강을 위한 품사 대체와 특징 공간 보간'(PMixUp: Simultaneous Utilization of Part-of-Speech Replacement and Feature Space Interpolation for Text Data Augmentation)하는 방안을 제안한다.

논문은 데이터가 충분하지 않아 효과적인 모델 학습이 어려운 상황에서 유의어로 교체와 특징 공간 보간(Feature Space Interpolation)을 동시에 적용한 데이터 증강(Data Augmentation) 기법에 대해 소개한다.

이 기법을 활용하면 데이터가 부족한 상황에서도 문장 분류 문제를 뛰어난 성능으로 풀어낼 수 있다.

쏘카는 이러한 연구 성과 등을 토대로 플랫폼 운영 효율 개선에 박차를 가하고 있다. 플랫폼 운영을 통해 얻은 자연어 데이터를 기반으로 쏘카 도메인을 가장 잘 이해할 수 있는 AI 모델도 개발하고 있다.

쏘카는 이르면 연내 해당 AI 모델을 기반으로 한 AI 고객센터 솔루션을 도입할 계획이다.

김창성 기자 solrali@mt.co.kr
<저작권자 ⓒ '성공을 꿈꾸는 사람들의 경제 뉴스' 머니S, 무단전재 및 재배포 금지>

Copyright © 머니S & moneys.co.kr, 무단 전재 및 재배포 금지

이 기사에 대해 어떻게 생각하시나요?