챗GPT 韓사용자 올해 2배 증가... “‘소라’ 출시는 안전성 확보된 후에”

Open AI CSO 제이슨 권 인터뷰
GPT-4o, 컴퓨팅 능력 확장해
한국어 번역 성능 크게 개선
Open AI, 오픈 소스 아니지만
개발자들에 편한 작업환경 제공
EU AI법, 명확성과 책임 여부 중요
한국, 정부주도 AI 성장 두드러져
높은 디지털 연결성은 AI 스타트업 잠재력

2022년 혜성처럼 챗GPT를 등장시키며 전세계 사람들에게 생성형AI의 가능성을 깨우친 오픈AI. 회사 측에 따르면 국내에서도 어느덧 사용자가 크게 늘어나 지난달 기준 주간 활성 사용자수가 300만명 이상에 다다랐다. 인천광역시 인구보다 많은 수준이자, 연초에 비해서는 2배로 증가한 규모다. 이는 오픈AI가 멀티모달리티(글뿐 아니라 말·동영상·3D 정보 등 다양한 형태로 소통하는 방식) 측면에서 뛰어난 역량과 다양한 솔루션을 지속적으로 출시했기 때문이다.

동시에 오픈AI는 프라이버시, 저작권, 편향성 등 AI가 직면한 여러가지 윤리적·법적 문제에 봉착하기도 했다. 매일경제는 제이슨 권 오픈AI 최고전략책임자(CSO)를 만나 회사가 그리는 AI의 미래와, 그가 바라보는 AI 윤리적·법적 딜레마에 대해 물었다. 한국계 미국인인 권 CSO는 소프트웨어 엔지니어이자 변호사, 실리콘밸리 Y 컴비네이터의 법률 고문을 맡은 경험을 살려 오픈AI에서도 윤리적·법적 문제를 총괄하고 있다.

지난해 오픈AI 내부에서 샘 올트먼 최고경영자(CEO)를 축출하려는 시도가 있었을 때 올트먼 CEO를 적극적으로 옹호한 최측근으로 통하기도 한다. 다음은 일문일답.

-오픈AI는 최근 GPT-4o를 공개한 데 이어 동영상 생성 AI인 ‘소라’, 그 다음 시리즈인 GPT-5 등 신제품 출시를 앞두고 있다. 이를 통해 오픈AI는 어떤 방향으로 나아가고 있나?

=멀티 모달리티다. 처음에 우리는 텍스트 기반의 챗봇으로 시작했지만, 이후 이미지를 추가했다. 그 다음에는 음성 인식 기능을 추가했는데, 이게 바로 GPT-4o다.

소라도 언젠가 출시될 예정이지만 출시할 때 매우 신중해야 한다. 비디오가 사람들에게 미칠 영향은 텍스트와 다르기 때문에 잠재적인 오용 방법에 대해서도 신경을 써야 한다고 생각한다. GPT-5가 출시된다면, 이 모든 기능들을 갖추게 될 것이고, 아마도 더 나아질 부분은 추론 능력과 관련된 작업 수행 능력일 것이다. 다른 AI 회사들도 비슷한 접근법에 집중하려는 모습을 많이 볼 수 있는데 이는 당연한 일이라고 생각한다. 이 도구들의 원래 목적이 사람들에게 더 많은 지능을 제공해 생산성, 창의성 등에 사용할 수 있도록 하는 것이기 때문이다.

-소라가 올해 안에 출시되지 않을 가능성도 있다고 봐야 할까?

=출시 일정에 대한 통제권이 없기 때문에 확실하게 말하긴 어렵지만, 소라는 좋은 제품이면서도 안전한 제품이라는 확신이 들 때 출시할 것이다.

-챗GPT-4o가 시장에 출시된 지 2~3개월이 지났다. 지금까지 소비자들의 반응을 어떻게 평가하나?

=첫 몇 달 동안은 제한적으로 제공되었기 때문에 반응 역시 제한적이다. API 고객들에게만 모델의 미니 버전이 제공되었는데 사람들은 그 기능을 매우 강력하게 느끼고 있는 것 같다. 올해 하반기쯤 소비자들의 반응을 본격적으로 알 수 있을 것 같다. 많은 사람들이 실시간 번역 기능과 대화를 나누는 기능을 통해 기술이 점점 더 인간적이라는 느낌을 받을 것이라 생각한다.

-한국에서는 GPT-4o가 한국어 번역이 많이 개선됐다는 평가가 있다.

=컴퓨팅 능력과 데이터 양을 확장했기 때문이다. 장기적으로 우리가 관심을 갖고 있는 부분은 모델이 영어만큼이나 많은 언어에서 효율적으로 작동하게 하는 것이다. 기본적으로 토큰화 기준으로 비용을 청구하는데, 언어마다 토큰 비용이 다르다. 한국어의 경우 특정 단어나 문자 세트의 토큰화 비용이 영어보다 비쌀 수 있다. 이를 해결하는 방법 중 하나는 토크나이저를 개선하는 것이며, 이 부분에 대해서도 계속해서 작업이 진행되고 있다.

-구글의 제미나이와 앤트로픽의 클로드3 등 여러 생성형 AI 언어 모델들이 발표되고 있다. 이 모델들과 비교했을 때, GPT 시리즈의 장점은 무엇이라고 생각하나?

=소비자 입장에서 챗GPT 시리즈의 장점은 기능이 더 광범위하다는 것이다. 제미나이나 클로드와 같은 다른 챗봇에서 할 수 있는 많은 텍스트 기반 대화 기능을 챗GPT에서도 사용할 수고 여기에 추가적으로 여러 모달리티(다양한 형식)를 가지고 있다. 앞으로 비디오 기능도 도입될 예정다. 이 점은 소비자 관점에서 중요하다고 본다.

개발자 관점에서 보면 챗GPT는 지속적으로 비용이 낮아지고 있고, 사용자들이 더 쉽게 규정을 준수할 수 있도록 도와주는 추가적인 기능들도 제공될 것이다. 구조화된 출력도 중요한 기능이다. ‘JSON 스키마’를 통하면 챗GPT에서 해당 데이터 스키마에 맞는 결과를 반환해준다. 기존 소프트웨어에서 가지고 있는 구조화된 데이터를 API에 쉽게 통합할 수 있는 것이다. 개인화 기능도 지속적으로 개선될 것이다. 챗GPT 자체에서도 더 많은 맞춤화가 가능해질 것이다. 또한 ‘GPT 스토어’도 우리가 집중하고 있는 또 다른 요소이다.

-개발자에게 챗GPT가 제공하는 기술과 관련해, 오픈AI의 ‘닫힌(Closed) 소스’ 에서도 가능한가?

=그렇다. 클로즈드와 오픈 소스의 차이가 개발자가 할 수 있는 일을 크게 제한하지는 않는다. 중요한 것은 API에 개발자가 작업을 수행할 수 있는 기능을 제공하는 것이다. 예를 들어 클라우드 아키텍처를 보면, 대부분의 사람들은 AWS, 구글 클라우드, Azure를 사용한다. 이들 기반 기술의 오픈 소스 버전을 찾을 수 있지만, 사람들이 사용하지 않는 이유는 클라우드 기술 주변에 편리한 기능들이 많이 구축되어 있어 배포가 쉽기 때문이다. AI에서도 비슷한 현상을 보게 될 것이다. 오픈 소스 모델을 실험하고 이를 기반으로 애플리케이션을 설계하는 사람들이 있을 것이고, 일부 개발자는 깊이 있게 접근하고 싶어 할 것이다. 대부분의 개발자들은 단순히 프로그램을 수행할 작업이 필요하고, 그 작업을 쉽게 처리할 수 있기를 원할 것이다. 이 점이 바로 API가 제공하는 가치라고 생각한다.

-언어 모델 시장은 어떻게 진화할까? 하나의 승자가 모든 것을 차지할 것까 아니면 각 모델이 특정 애플리케이션에 따라 자신만의 틈새 시장을 개척할까?

=개인적인 견해로는 후자에 가깝다고 생각한다. 인프라 클라우드 층에서는 몇몇 주요 플레이어만이 존재하며, 이는 클라우드 기반의 컴퓨팅 자원을 제공하는 핵심층이다. 그 다음으로는 모델 층이 있는데, 여기에는 다양한 플레이어들이 존재한다. 이 층에서는 다양한 언어 모델이 개발되며, 각 모델은 서로 다른 강점과 약점을 가지고 있다. 마지막으로 애플리케이션 층에서는 사람들이 이러한 모델을 기반으로 시스템을 구축한다. 여기에는 수많은 플레이어들이 있으며, 그들은 기본 모델을 가져와 자신들의 특정 용도에 맞게 미세 조정(fine-tuning)을 한다. 이와 같은 방식으로 특정 용도에 매우 적합한 모델을 커스터마이징하여 사용할 수 있다.

예를 들어, 한 대형 금융 기관이 우리 모델의 버전을 가져와 금융 관련 쿼리에 맞게 미세 조정하고, 내부 지식 기반을 쌓는 데 사용하고 있다. 이처럼 각 개발자들이 자신만의 커스터마이징된 모델을 만들어 특정 산업이나 용도에 맞게 사용하게 될 것이다. 따라서 이 기술을 기반으로 많은 다른 개발자들이 성공하고 발전하며, 비즈니스를 구축할 수 있는 많은 기회가 존재한다. 중요한 점은 우리가 모든 것을 할 필요가 없다는 것이다. 우리는 다른 사람들이 이 플랫폼을 통해 이익을 창출할 수 있는 도구를 제공한다.

-올해 초 EU가 통과시킨 AI법(AI Act)은 투명성, 설명 가능성, 인간의 감독 등을 요구하는 규제 사항들을 포함하고 있다. 이 법의 의미와 영향에 대해 어떻게 보는가?

=이 법의 주요 영향은 유럽에서 제품을 제공하려는 경우 해당 법을 준수해야 한다는 점이다. 유럽이 규제를 어떻게 설정하느냐에 따라 글로벌 시장에도 영향을 미칠 것이다.

이 법이 유럽 내에서의 AI 기술 채택에 어떤 영향을 미칠지 지켜보는 것도 중요하다. 규제와 기술 사이 ‘트레이드 오프’가 생길 것이다. 규제의 강도가 너무 높거나 복잡하면 유럽 내에서의 기술 도입이 느려질 수 있다. 그러나 잘 실행된다면 유럽이 윤리적 AI의 선두주자가 될 수 있으며, 안전과 개인정보 보호를 중시하는 혁신을 촉진할 수 있다.

이 법이 얼마나 효과적일지는 정책 입안자들이 AI 기술에 얼마나 익숙한지에 달려 있다. 실제로 AI를 사용해본 사람들은 규제를 더 효과적이고 균형 있게 작성할 가능성이 높다. 그러나 기술을 잘 모르는 사람들이 규제를 작성하게 되면, 혁신을 저해하거나 중요한 위험 요소를 놓칠 수 있다.

-‘트레이드 오프’에 대해 더 자세히 설명해 달라

=규칙의 명확성과 누가 어떤 책임을 지는지가 매우 중요할 것이다. 이 법안은 제공자와 배포자 간의 구분을 두고 있다. 모델을 만든 사람과 그 모델을 기반으로 (다른 모델을) 구축한 사람을 구분하는 것이다. 그런데 만약 당신이 특정 모델을 기반으로 다른 모델을 커스터마이징 했다고 치자. 당신은 모델을 만드는 사람인가, 아니면 단순히 모델의 사용자에 불과한가? 어떤 역할을 하느냐에 따라 다른 규칙이 적용되고 이러한 규칙이 명확하지 않다면 시스템이나 모델을 구축하려는 조직들은 이를 하지 않을 수도 있다.

이 점은 유럽 고객들로부터 듣는 우려 중 하나다. 그들은 법안이 자신들에게 어떤 영향을 미칠지 확신하지 못하기 때문에 불안해하고 있다. 만약 그들이 불안감 때문에 참여하지 않는다면 이 분야에서 뒤처지는 결과는 매우 클 것이다. 왜냐하면 이번(AI)에는 단순히 클라우드나 검색, 소셜 미디어만이 아니라 ‘지능’에 대해 이야기하고 있기 때문이다.

=AI모델의 훈련이 미국에서 이루어지기 때문에 법적으로는 공정 사용(Fair Use･저작권으로 보호되는 저작물을 저작권자의 허가를 구하지 않고 제한적으로 이용할 수 있도록 허용하는 미국 저작권법상의 개념)에 의해 보호된다고 생각한다. 하지만 문화적으로는 이 생태계를 발전시키는 것이 합리적이라고 본다. 그래서 단순히 공정 사용에 의존하는 것만이 아니라, 이 문제에 대해 관심이 많은 분야와 협력해 그들이 이 기술을 잘 활용할 수 있도록 돕는 것이 우리의 목표다.

서치GPT(챗GPT의 새로운 실시간 AI 검색 모델)는 좋은 사례다. 만약 누군가가 검색 인덱스나 훈련 세트에 포함되기를 원하지 않으면, 이를 옵트아웃(opt-out)할 수 있다. 포함되기를 원하는 경우 우리는 그들과 계약을 맺어 그들의 결과가 표시되도록 할 수 있다. 또한 그들이 옵트인(opt-in)하면, 검색에서 나오는 트래픽을 그들에게 다시 보낼 수 있도록 하는 계약도 체결할 수 있다. 이렇게 우리는 AI가 모든 것을 다 하는 것이 아니라 AI를 중심으로 생태계를 구축하는 방식으로 접근하고 있다.

=시장이 모범 사례(best practices)에 안착하도록 한 다음 규칙 설정을 고려하는 것도 하나의 방법이라고 생각한다. 우리가 시도하는 것 중 하나가 바로 이것이다. 예를 들어, 훈련 세트에 포함되기를 원하지 않으면 옵트아웃할 수 있도록 하고, 챗GPT가 답변을 생성할 때 단순히 저작권이 있는 정보를 반복하지 않도록 연구를 진행한다. 그리고 제품을 설계할 때 콘텐츠를 제공하는 사람들과 비즈니스 파트너십을 맺을 방법을 찾는다. 이것이 가장 합리적인 모범 사례라고 생각한다. 만약 이러한 접근이 실제로 효과를 발휘하고 큰 가치를 제공한다면 이를 기반으로 법률을 제정하는 것을 고려할 수 있다.

만약 시장이 잘 자리 잡으면 그럴 필요가 없을 수도 있다. 검색을 생각해보면 분명히 소송이 있기는 했지만 미국에서는 인터넷 검색에 대한 규칙이 없다. 이는 시장이 잘 자리 잡았기 때문이다. 검색엔진이 당신의 모든 콘텐츠를 인덱싱하고, 사람들이 당신의 콘텐츠를 찾을 수 있으며, 그 결과로 트래픽을 당신에게 보내는 좋은 교환이 이루어졌기 때문이다. 이처럼 사람들이 AI가 자신들에게 실질적인 이익을 가져다준다고 느끼는 생태계를 구축할 수 있다면, 그게 아마도 최고의 해결책일 것이다. 현재 입법자들이 지금 당장 이 기술에 대해 최선의 답을 내놓기는 어렵기 때문이다. 이 기술의 도입은 이제 겨우 1년 반에서 2년밖에 되지 않았고, 아직 매우 초기 단계에 있기 때문에 시장이 무엇이 합리적인지를 알아가도록 하는 것이 좋다고 생각한다.

-오픈AI 내부에서 기술이 사람들에게 미칠 부정적인 영향을 어떻게 다루고 있는가?

=오픈AI는 도구를 출시하기 전에 많은 테스트를 수행하고, 도구에 다양한 안전 장치를 설계하며, 이러한 과정에서 우리가 어떤 위험을 발견하고, 어떻게 이를 완화했는지에 대한 보고서를 발행한다. 예를 들어, 최근에 GPT-4의 시스템 카드를 공개했는데, 이 문서에는 기술의 잠재적 위험, 우리가 수행한 테스트, 그리고 적용된 위험 완화 조치가 상세히 설명되어 있다. 이는 기술이 잘못 사용되거나, 의도치 않은 결과를 초래할 수 있다는 점을 염두에 두고 개발 프로세스에 우선순위를 두는 방식이다.

-오픈AI는 한국의 많은 스타트업들과도 협업하고 있다. 산업, 기술적 측면에서 한국의 AI 환경을 평가한다면?

=한국은 스타트업 생태계를 위한 정부의 의도적인 지원이 두드러진다는 점이 흥미롭다. 예를 들어, 한국 정부는 벤처 펀드에 투자해 한국 스타트업에 자금을 제공하는 등 더 많은 사람들이 리스크를 감수하고 창업에 도전할 수 있도록 환경을 조성하려고 한다. 이를 통해 스타트업들이 더 많은 가시성을 얻고, 대기업과의 협력을 통해 배급망을 확보하며, 글로벌 시장으로 진출한다.

또한 한국은 높은 디지털 연결성 덕분에 스타트업들이 빠르게 성장할 수 있는 잠재력이 있다. 특히 문화적 현상인 K-팝과 연결될 수 있다면, 이는 큰 이점을 제공할 수 있다고 생각한다. K-팝은 강력한 문화적 파급력을 가지고 있으며, 기술이 소비자들에게 채택되는 방식에 중요한 영향을 미칠 수 있다. 예를 들어, 틱톡은 단순한 비디오 클립 플랫폼이지만, 밈 문화와 음악을 결합하여 큰 성공을 거두었다. 이는 단순히 기술적 요소를 넘어, 문화적 현상을 잘 활용한 결과다. 한국의 스타트업들도 K-팝과 같은 문화적 요소를 활용하여 더 큰 성공을 거둘 수 있는 기회를 모색하는 것이 중요하다.

이 기사에 대해 어떻게 생각하시나요?

매일경제에서 직접 확인하세요. 해당 언론사로 이동합니다.