로앤컴퍼니, 형사 범죄 데이터 16만건 무료 공개
“법률 AI 연구 저변 넓힐 것”
법률서비스 플랫폼 ‘로톡(LawTalk)’ 운영사 로앤컴퍼니는 14일 법률 AI 데이터셋 클레이드(KLAID, Korean Legal AI Datasets)를 무료로 공개하고 다음 달 4일까지 AI 모델 개발 경진대회 ‘클레이드 챌린지 2022’를 개최한다고 밝혔다. 클레이드는 로앤컴퍼니가 자체 보유한 데이터를 기반으로 만든 ‘한국어 법률 AI 데이터셋’이다.
이번에 공개하는 데이터셋은 로앤컴퍼니가 보유한 약 320만 건의 판결문 중 55만건의 1심 형사사건을 분석해 뽑아낸 ‘형사 범죄 분류’ 데이터 16만건이다. 범죄사실과 그에 따른 적용 법조를 하나의 쌍으로 구성했다. 또 시기별로 다를 수 있는 적용법조를 최신 법개정에 맞춰 일원화해 AI 연구자들의 데이터셋 활용이 용이하도록 했다.
해당 데이터를 활용하면 피고인의 범죄사실에 대해 위반한 법령을 추측하는 AI 모델을 개발할 수 있다. 로앤컴퍼니는 챌린지 참가자들로부터 AI 모델을 제출받아 해당 모델이 얼마나 정확하게 범죄를 분류하는지 점수화해 홈페이지 리더보드에서 결과를 공개할 예정이다.
경진대회는 AI 모델 개발에 관심 있는 대학생 혹은 대학원생이라면 클레이드 홈페이지에서 개인 또는 팀으로 자유롭게 응모가 가능하다. 참여자 중 AI 모델 평가에서 가장 높은 점수를 기록한 1명(팀)에게는 총 300만원의 상금을 수여할 계획이다. 또 대회에 참가한 모든 사람들에게는 대회명이 새겨진 기념품을 제공한다. 최종 수상자는 12월 22일 홈페이지를 통해 발표된다.
한편 판결문은 법률문제에 대한 다양한 사실 관계 및 주장, 이에 대한 법원의 법리 판단과 결론을 한눈에 볼 수 있어 법률 AI 연구 개발에 핵심 데이터로 꼽힌다. 하지만 아직까지 무료로 공개되는 판결문은 그 수가 적고 AI 연구 학습을 위한 법률 AI 데이터셋 확보가 쉽지 않아 일반 연구자들이 접근하기에 많은 어려움이 따른다.
실제로 AI 통합 플랫폼 ‘AI 허브’에 등록된 법률 AI 데이터셋에서 형사재판 판결문은 수천건에 불과한 수준이다. 로앤컴퍼니는 이번 16만건에 달하는 법률 AI 데이터셋 공개를 통해 ‘리걸테크’ 분야에서 법률 AI 연구 활성화에 큰 도움이 될 것으로 기대하고 있다.
김본환 로앤컴퍼니 대표는 “해외에 비해 열악한 국내 법률 AI 연구 환경에서 국내 최다 규모의 법률 AI 데이터셋을 개방해 인공지능 연구자들에게 활발한 연구 개발의 장을 마련했다는 점에 의미가 있다”며 “리걸테크 대표 기업으로서 향후 적극적인 연구 지원 활동을 모색해 법률 AI 연구 생태계 활성화에 앞장서 리걸테크 산업 발전에 기여하겠다”고 밝혔다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 가상화폐 거래소 FTX 파산 직격탄...컴투스·위메이드 주가 급락[이종화의 세돌아이] - 매일경제
- [속보]한동훈 “유족 의사 반하는 명단공개 법적으로 큰 문제” - 매일경제
- 상금 무려 1300억원…‘용기와 존중상’ 받은 유명 女가수의 정체 - 매일경제
- “넌 너무 뚱뚱해”…독설 할머니 덕에 美여성, 이것 먹고 50kg 뺐다 - 매일경제
- [단독] 허경환, 닭가슴살 팔아 80억 건물주 됐다 - 매일경제
- “3년 간 시간 멈춰”...‘보복 협박’ 양현석 최후진술 보니
- “이젠 떠날 때”...돌아온 6만전자에 개인 7650억원 팔았다 - 매일경제
- 김치 200㎏ 싣고 도하 온 벤투호, 매운맛 보여줄까 - 매일경제
- 오마이걸 아린, 귀여운데 섹시하기까지 [똑똑SNS] - MK스포츠
- ‘日 남친♥’ 이세영 “이기적이네” 소리 부른 탄탄 몸매 [똑똑SNS] - MK스포츠