"누구나 쉽게 쓰는 '생성형 AI'…정책에도 이용할 단계 왔다"
데이터 분석 질 높이고 업무 효율성 향상, AI 도입 필수
내부 시범 개발 결과, 1주일 걸릴 업무 1시간이면 끝나
연내 직원들 스스로 '맞춤형 AI' 개발할 수 있도록 할것
[편집자주] 우리 삶을 바꿀 중대한 글로벌 이슈와 어젠다를 톺아보는 머니투데이 연례 콘퍼런스 키플랫폼(K.E.Y. PLATFORM)이 2024년 우리 기업들이 현재의 경제 생태계에서 살아남고 성장하는데 필수적인 디지털 전환(DX)을 위한 혁신과 리더십에 대해 국내외 최고 전문가들의 인사이트를 지상중계합니다.
국가 과학기술의 미래를 예측하고 R&D(연구·개발)사업을 분석·평가하는 연구기관인 한국과학기술기획평가원(KISTEP·키스텝)이 '디지털 대전환 시대'에 맞춰 생성형 AI(인공지능)를 전격 도입한다. 과학기술 현안과 이슈를 빠르게 검색해 신뢰성 높은 답변을 얻을 수 있는 이른바 'KISTEP GPT'다.
최근 서울 중구 KISTEP 서울평가회의장에서 만난 정병선 KISTEP 원장은 "누구나 생성형 AI를 쉽게 쓸 수 있는 시대지만 생성형 AI를 도입한 공공기관은 아직 많지 않다"며 "국가적 인사이트를 제시하는 기관인 KISTEP이 먼저 시범에 나설 것"이라고 말했다. 그는 오픈소스를 활용, 직접 구축 중인 KISTEP AI모델을 하나하나 시연했다.
정 원장은 행정고시(34회)로 공직에 입문해 과학기술정보통신부 연구개발정책실장, 과기정통부 제1차관 등을 지내며 30여년간 국가 R&D정책을 이끌어온 인물이다. 서울대 경제학과를 졸업하고 영국 서섹스대에서 과학기술정책으로 연구석사 학위를 받았다. 그는 석사 시절 PC 운영체제 중 하나인 리눅스(Linux) 개발과정을 주제로 논문을 썼다. 정 원장은 "그때 오픈소스의 가치를 깨달았다"고 말했다. 리눅스는 소프트웨어 프로그래밍의 설계도인 소스코드를 누구에게나 공개·배포한다. 참여자는 공개된 코드를 바탕으로 소프트웨어의 버그(결함)를 발견, 수정하거나 새로운 기능을 추가할 수 있다. 다수의 개발자를 거치면서 소프트웨어는 빠르게 개발되고 확장된다.
KISTEP은 방대한 정부 R&D과제 정보를 한데 모아 AI에 검색, 분류, 분석, 문서요약, 통계까지 작성토록 하는 'KISTEP DAPT(Domain Adaptive Pretrained·도메인 적응 추가 사전학습) 모델'을 개발 중이다. 이 역시 개발코드 공개 웹사이트 '깃허브'(GitHub) 등에 공개된 코드를 활용했다. 광범위한 과학기술계 R&D의 현황과 동향을 분석하는 KISTEP의 미션에 생성형 AI를 활용해 속도감과 효율성을 부여한다는 계획이다.
'KISTEP DAPT 모델'은 KISTEP이 지금까지 발간한 각종 브리프, 보고서, 동향분석 자료는 물론 정부 회의체에서 나온 자문회의 안건, 각종 품의문서 등을 학습데이터로 활용한다. 각종 논문, 특허자료, 신문기사 등 외부 웹페이지에서 크롤링(crawling)한 데이터를 학습하기도 한다. 크롤링은 웹페이지를 그대로 가져와 데이터를 추출하는 작업을 말한다. 이처럼 학습한 데이터를 바탕으로 사용자가 '12대 국가전략 기술은 무엇인가요'라고 질문하면 주제의 범위에 맞는 보다 정확한 답을 내놓는다. 일종의 '과학기술정책 전문' 챗GPT인 셈이다.
아래는 정 원장과 일문일답.
-챗GPT 등 거대 생성형 AI가 있음에도 국내 서비스를 자체개발해야 하는 이유는.
▶'똑똑한 만물박사'와 '좁지만 깊은 전문가'의 차이라고 볼 수 있다. 말 잘하고 이것저것 아는 인물도 필요하지만 특정분야의 진짜 전문가도 필요하다. 특히 급변하는 환경에서 요구에 맞는 도움을 받으려면 '깊음'이 더 중요하다고 본다. 우리만의 과학정책 전문 GPT를 개발해야 하는 이유이기도 하다. 보안과 정확성 문제도 있다. AI에서 '뇌'를 담당하는 게 LLM(거대언어모델)이다. 오픈AI의 챗GPT나 구글 제미나이에 국가 전략기술과 관련한 질문을 하면 이들의 LLM에 해당 질문과 관련한 데이터가 쌓인다. 이는 정보보안에 문제가 생길 수 있다는 얘기다. '할루시네이션'(Hallucination·조작된 정보생성)의 위험도 크다. 포괄적 데이터를 학습한 LLM이 맥락과 다른 허위정보를 생성해 '그럴듯한 답변'을 내놓는 건데 정확한 지식과 분석이 필요한 정책기관은 이를 활용할 수 없다.
-KISTEP이 먼저 자체 생성형 AI 개발에 나섰는데.
▶생성형 AI를 누구나 쉽게 쓸 수 있는 시대가 왔다. 지금까지는 AI를 이용하는 공공기관이 많지 않았는데 정책에도 생성형 AI를 이용할 단계가 됐다고 본다. 국가정책이 점점 복잡해지면서 데이터양도 기하급수적으로 늘어나 정책을 분석하는데 시간이 너무 많이 들기 때문이다. 특히 KISTEP은 국가 R&D 조사·분석, 평가를 도맡아 보유 정보량이 많다. 분석의 질을 높이면서도 업무효율성을 높이려면 AI 도입이 필요하다고 봤다. 실제 내부에서 시범적으로 개발해본 결과 통상 1주일 걸린 업무를 1시간이면 끝낼 수 있었다.
-원장이 직접 나서 코딩부터 한다던데.
▶군대에 있을 때부터 코딩을 배웠으니 코딩에 대한 관심은 꽤 오래됐다. 깃허브(GitHub)와 허깅페이스(Hugging Face) 등 개발자 플랫폼에 공개된 프로그래밍 코드와 LLM을 가져와 조금만 손보면 우리만의 모델을 만들 수 있다. 연구원 내부에 AI를 다루는 직원이 별로 없어 외부용역을 활용해왔는데 이 구조로는 업무의 지속성이 떨어진다고 판단, 올해부터는 AI 전환 TF(태스크포스)를 꾸려 현재 15명의 직원이 근무 중이다.
-실제 구현된 사례가 있나.
▶현재 KISTEP 내부망을 통해 직원들이 이용할 수 있는 TF 홈페이지를 시범적으로 운영 중이다. 'h2o GPT'라는 오픈소스 GPT를 활용했다. 예컨대 '글로벌 R&D 협력의 우리나라 현황과 한계는'이라는 질문을 던지면 30초~1분 안에 내부 DB(데이터베이스)를 기반으로 정보를 찾아준다. 목차를 지정할 수도 있다. '정책대안을 다음 목차로 작성해주세요. 배경 및 필요성, 글로벌 동향, 정책대안 등'이라고 지시하면 이에 맞게 목차를 나눠 답변한다. 아직은 개발단계여서 한글이 아닌 영어로만 답변하는 한계가 있는데 최근 출시된 한국어 특화 LLM '구름3'를 적용하면 한국어 답변도 가능할 것으로 기대한다.
-KISTEP 전직원이 AI를 활용해 업무를 할 수 있게 될까.
▶오픈소스를 활용해 지금까지 약 20개 검색·분석·요약서비스를 내부적으로 도입했는데 올해 말까지 전 직원이 자유롭게 AI를 쓸 수 있도록 하는 게 목표다. 오픈소스를 활용하는 방법을 배우기만 한다면 직원들도 활용목적에 맞게 스스로 '맞춤형 AI'를 개발할 수 있을 것이다. AI는 인간의 노동력을 대체하는 게 아니라 인간의 능력을 증강하는 도구다. 신체능력이 남보다 증강된 영웅 캐릭터가 '슈퍼맨'이라면 AI는 인간의 지성을 높이다. 이처럼 지성적인 분석력을 높이는 툴을 누구나 한두 개 보유해 활용한다면 지금보다 업무효율이 훨씬 올라갈 것으로 본다.
-KISTEP의 비전을 한마디로 정의한다면.
▶'누구나 AI, 무엇이든 AI, 어디서나 AI'다. 모두 자유자재로 AI를 활용해 지금보다 훨씬 효율적으로 일하는 환경을 구축하는 것이다.
박건희 기자 wissen@mt.co.kr
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지
- "하트시그널 출연자, 빌린 돈 안 갚고 잠수 타"…사기 혐의 피소 - 머니투데이
- 르세라핌 라이브 논란 '시끌', 사쿠라가 남긴 글…"완벽한 사람은 없어" - 머니투데이
- 선우은숙 쓰러졌다는데…유영재, 생방송서 의미심장 발언 - 머니투데이
- '아동 성폭행' 고영욱, 이상민 저격?…"70억 갚았단 말에 무기력" - 머니투데이
- "남희석, 전국노래자랑서 홀대받고 있다"…의혹 제기된 이유는 - 머니투데이
- 무대 내려오면 세차장 알바…7년차 가수 최대성 "아내에게 죄인" - 머니투데이
- '토막 살인' 양광준의 두 얼굴…"순하고 착했는데" 육사 후배가 쓴 글 - 머니투데이
- 쓰레기 먹이며 추행까지…재판서 울먹인 '고3 가스라이팅' 20대 여성 무당 - 머니투데이
- "4만전자 너무 했지, 지금이 줍줍 기회"…삼성전자 8% 불기둥 - 머니투데이
- "전기차 보조금 없애라" 머스크 속내는…'나만 살고 다 죽자'? - 머니투데이