오픈AI가 처음으로 푼 오픈소스, 하필 ‘검열관’이었을까 [정원훈의 AI 트렌드]

정원훈 텐에이아이 대표 2026. 5. 1. 06:00
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

허깅페이스 4월 5주차 AI 동향 분석

인공지능(AI) 트렌드를 가장 빠르게 알 수 있는 허깅페이스를 분석하는 정원훈의 AI 트렌드입니다. 이번 주 허깅페이스는 한마디로 '1조를 깨우고, 사생활을 지우고, 세계를 그려낸' 한 주였습니다.

중국 딥시크(DeepSeek)가 1.6조 파라미터급 오픈소스 거대언어모델을 풀어 폐쇄형 프런티어 모델의 아성을 정면으로 흔들었습니다. 오픈AI는 처음으로 '닫힌 회사'라는 별명을 잠시 내려놓고, 개인정보를 자동으로 가려주는 경량 오픈소스 모델을 깜짝 공개해 보안업계의 주목을 받았습니다. 게임 개발자가 아닌 일반인도 RTX 한 장으로 'AI가 실시간으로 그려내는 세계' 속을 걸어 다닐 수 있는 인터랙티브 월드 모델까지 등장했습니다.

이번 주의 키워드는 세 가지입니다. '1.6조 파라미터·100만 토큰 컨텍스트로 무장한 딥시크 V4-프로(DeepSeek-V4-Pro)', '1.5B 경량 모델로 8가지 개인정보를 잡아내는 오픈AI의 프라이버시 필터(OpenAI Privacy Filter)', 'RTX 3090 한 장에서 60FPS로 AI가 그리는 세상을 누비는 오버월드의 웨이포인트 1.5(Waypoint 1.5)'입니다. 이번 주도 퀴즈로 시작하겠습니다.

총 1.6조(1.6T) 파라미터 중 단 49B만 활성화되는 MoE(전문가 혼합) 구조에, 100만 토큰 컨텍스트와 '하이브리드 어텐션'을 적용해 오픈소스 추론·에이전트 성능에서 단숨에 정상권에 진입한 이 모델은 무엇일까요. 

가중치 1.5B 중 50M만 활성화되는 희소 MoE 구조로, 노트북 CPU에서도 동작할 만큼 가볍습니다. 이름·주소·이메일·전화번호·날짜·계좌번호·URL·비밀(API 키 등) 등 8가지 개인정보(PII)를 단 한 번의 추론으로 가려내, 채팅 입력창에 붙이기 전에 민감 정보를 자동으로 마스킹할 수 있게 해줍니다. 아파치 2.0 라이선스로 풀린 이 모델의 이름은 무엇일까요.

정답은 'DeepSeek-V4-Pro'와 'OpenAI Privacy Filter'입니다. 그럼 이번 주에는 어떤 혁신이 등장했는지 함께 살펴보겠습니다.
4월 5주차 허깅페이스 모델 톱3와 스페이스 톱3 /정원훈 제공

AI 모델 톱3

1위: Deepseek-ai/DeepSeek-V4-Pro | Text Generation

"1.6조 파라미터, 100만 토큰… 오픈소스가 프런티어 모델의 멱살을 잡았다"

이번 주 허깅페이스를 가장 뜨겁게 달군 모델은 단연 딥시크(Deepseek) V4-프로입니다. 총 1.6조(1.6T) 파라미터 중 49B만 골라 활성화하는 MoE(Mixture of Experts·전문가 혼합) 구조에, 무려 100만 토큰의 컨텍스트 윈도를 기본 탑재했습니다. 한국 단행본 기준으로 7~8권 분량의 텍스트를 한 번에 통째로 읽고 추론한다는 뜻입니다.

진짜 포인트는 '효율'입니다. 기존 V3.2 대비, 100만 토큰 환경에서 토큰당 추론 연산량(FLOPs)을 27%, KV 캐시 메모리는 10% 수준으로 줄였다는 게 딥시크의 설명입니다. 이를 가능케 한 핵심 기술은 'CSA(압축 희소 어텐션)'와 'HCA(고압축 어텐션)'를 결합한 하이브리드 어텐션 아키텍처입니다. 쉽게 말해, 가까운 문맥은 또렷이 보고 먼 문맥은 압축해서 본다는 사람의 독서 습관을 모델에 이식한 셈입니다.

성능 수치도 만만치 않습니다. 최대 추론 모드인 V4-프로 맥스(Pro-Max)는 인공지능분석(Artificial Analysis)이 매기는 '에이전트 실무 벤치(GDPval-AA)'에서 1554점을 기록해 Kimi K2.6, GLM-5.1 등 동급 오픈소스 모델을 모두 제쳤습니다. '오픈소스 추론 인덱스'에서는 Kimi K2.6에 이어 2위에 올랐습니다. 더 충격적인 건 가격입니다. 같은 벤치마크 한 회 통과 비용이 클로드 오퍼스 4.7 대비 4분의 1 수준으로 측정됐습니다.

코딩에 특화된 점도 주목할 만합니다. 딥시크 자체 발표에 따르면, V4-프로는 사내 에이전트 코딩 환경에서 이미 주력 모델로 자리 잡았으며, 클로드 코드(Claude Code)·오픈코드(OpenCode)·오픈클로(OpenClaw) 등 주요 코딩 에이전트와 즉시 호환됩니다. 라이선스는 MIT로, 상업적 이용에도 사실상 제약이 없습니다.

어디에 활용할 수 있을까요? 100만 토큰을 활용한 대규모 계약서·사업보고서·10-K 분석, 자율 코딩 에이전트 기반 SW 리팩토링·디버깅, 장시간 멀티스텝 도구 호출이 필요한 R&D 자동화, 사내 챗봇 백엔드 등 '큰 머리·긴 호흡·낮은 비용'이 동시에 요구되는 작업에 적합합니다.

2위: Deepseek-ai/DeepSeek-V4-Flash | Text Generation

"284B로 똑같이 100만 토큰을 본다… 가성비의 새 기준이 등장했다"

V4-프로의 동생 격인 V4-플래시는 '얕고 빠른 두뇌'입니다. 총 284B 파라미터 중 13B만 활성화되는 더 가벼운 MoE 모델이지만, 100만 토큰 컨텍스트와 사고(Thinking)·즉답(Non-thinking) 듀얼 모드를 형 모델과 동일하게 지원합니다.

핵심 수치를 살펴보면 흥미롭습니다. 일반적인 챗봇 대화, 한 번의 코드 자동완성, 단발성 요약 같은 '대다수 실무 작업'에서는 V4-프로와의 성능 격차가 1~3점에 불과합니다. 라이브코드벤치(LiveCodeBench), MMLU-프로(MMLU-Pro) 같은 한정된 추론 벤치마크에서는 형 모델의 턱밑까지 따라붙었다는 평가입니다. 사용자가 체감하기 힘든 수준의 차이라는 뜻이죠.

다만 '약점'도 분명합니다. 다단계 도구 호출이 필요한 터미널벤치 2.0(Terminal Bench 2.0)이나 사실 회상(SimpleQA-Verified)에서는 형 모델 대비 10점 이상 떨어집니다. 실시간 코딩 어시스턴트, 인터랙티브 창작 도구처럼 '속도가 곧 경쟁력'인 영역에서는 V4-플래시가 정답에 가깝지만, 30단계 자율 에이전트 루프를 돌리는 작업이라면 형 모델을 권장하는 이유입니다.

특히 흥미로운 포인트는 '플래시-맥스(Flash-Max)' 모드입니다. 플래시에 더 큰 사고 예산(Thinking Budget)을 주면 V4-프로에 근접하는 추론 능력을 보여준다는 게 딥시크의 주장입니다. '돈을 적게 들이고도 머리를 더 굴리게 하면 비슷해진다'는 사용자에게 선택의 폭을 주는 전략입니다.

어디에 활용할 수 있을까요. 대용량 채팅 트래픽 처리, 실시간 자동 응답, 다국어 번역 파이프라인, 코드 자동완성, 빠른 회의록 요약 등 '많이·빠르게·저렴하게'가 핵심인 모든 운영 환경에 적합합니다.

3위: Openai/privacy-filter | Token Classification

"내 데이터를 보내기 전에 한 번 거른다… 오픈AI가 처음 풀어준 '오픈소스 검열관'"

이름에서 짐작했듯, 이 모델은 글을 쓰지 않습니다. 오히려 글에서 '지워야 할 곳'을 콕 집어주는 모델입니다. 오픈AI가 4월 22일 아파치 2.0 라이선스로 풀어준 이 모델은 영구적으로 '닫힌 회사'라는 별명을 가진 회사가 모처럼 내놓은 오픈소스라는 점만으로도 화제가 됐습니다.

핵심 구조는 의외로 영리합니다. 총 파라미터는 1.5B에 불과한데, 그중 단 50M(0.05B)만 활성화되는 MoE 설계를 채택했습니다. 노트북 CPU에서 4~8GB 램만 있어도 동작한다는 뜻입니다. GPT-OSS와 유사한 트랜스포머 백본을 양방향(Bidirectional) 인코더로 변환해 토큰을 한 번에 전부 읽고 한 번의 추론으로 라벨을 붙이는 구조입니다. 컨텍스트 길이는 12만8000 토큰에 달해 300쪽짜리 계약서나 2시간짜리 회의 녹취록을 통째로 한 번에 처리할 수 있습니다.

탐지하는 개인정보(PII)는 8가지입니다. ▲이름(private_person) ▲주소(private_address) ▲이메일(private_email) ▲전화번호(private_phone) ▲URL(private_url) ▲날짜(private_date) ▲계좌번호(account_number) ▲비밀(secret·API 키, 비밀번호, 고엔트로피 문자열 등)이 그것입니다. 이를 BIOES(Begin-Inside-Outside-End-Single) 라벨링으로 33개 토큰 클래스에 매핑해 정밀하게 잡아냅니다.

진짜 의미는 '온디바이스'라는 점입니다. 모델 가중치를 한 번만 내려받으면, 그 후로는 인터넷 없이도 동작합니다. 의료기관 카드뮴 차단망 안, 군사용 폐쇄망, 금융사 보안실 등 USB 한 개로 가중치를 옮겨 사용하는 시나리오까지 공식 문서가 가정하고 있습니다. 챗GPT·클로드·노트북LM 등 외부 AI에 문서를 올리기 전, 일종의 '게이트키퍼'로 두라는 것이 오픈AI의 권장 사용법입니다.

어디에 활용할 수 있을까요. 사내 LLM 호출 직전의 PII 자동 마스킹 게이트웨이, 콜센터 음성 텍스트화 후 자동 비식별화, 법률·의료 문서의 사전 가명처리, 사내 위키·로그·인덱싱 파이프라인의 개인정보 사전 검열 등 '데이터를 외부로 보내기 직전 마지막 검문소'가 필요한 모든 환경에 적합합니다.

AI 응용프로그램(Spaces) 톱3

허깅페이스 스페이스는 AI 모델을 웹 브라우저에서 바로 체험할 수 있는 플레이그라운드입니다. 코드 한 줄 없이 최신 AI 기술을 만져볼 수 있죠. 이번 주 가장 뜨거운 스페이스 3곳을 소개합니다.

1위: Waypoint 1.5 Small | Overworld

"마우스를 움직이면 세계가 그려진다… AI가 실시간으로 만드는 게임 속으로"

이번 주 가장 충격적인 데모가 등장했습니다. 오버월드(Overworld)가 공개한 웨이포인트 1.5는 단순한 영상 생성 모델이 아닙니다. 텍스트 프롬프트로 세계를 묘사하고, 키보드와 마우스로 조작하면 AI가 '그 다음 화면'을 실시간으로 그려내는 인터랙티브 월드 모델입니다.

핵심 수치를 살펴보면 입이 떡 벌어집니다. RTX 3090부터 5090까지의 데스크톱 GPU에서 720p, 60FPS로 동작합니다. 게이밍 노트북을 위한 360p 경량 버전도 함께 공개됐습니다. 데이터센터급 클러스터가 아니라 개인 PC 안에서 AI가 게임 화면을 한 프레임씩 만들어낸다는 의미입니다. 학습 데이터는 1만 시간 분량의 게임 영상에 컨트롤러 입력과 텍스트 캡션을 일일이 페어링한 결과물로, 1세대 웨이포인트 대비 약 100배 늘렸다는 게 오버월드의 설명입니다.

체험 방식은 두 가지입니다. 허깅페이스 스페이스에서 브라우저로 즉시 데모를 만져볼 수도 있고, 오버월드 바이옴(Biome) 런타임을 설치해 자기 PC에서 직접 돌릴 수도 있습니다. '시드(seed) 이미지'를 한 장 올리면, 그 이미지를 출발점으로 한 가상 세계가 끝없이 펼쳐집니다.

다만 한계도 분명합니다. 오랜 시간 탐험하다 보면 지형이 흐트러지거나 캐릭터가 사라지는 등 '물리 법칙의 일관성'이 무너질 수 있다는 점, 그리고 어디까지나 시뮬레이터가 아닌 '꿈꾸는 모델'이라는 점은 사용자가 감안해야 합니다.

어디에 활용할 수 있을까요. 인디 게임 콘셉트 프로토타이핑, 영화·광고 사전 시각화(프리비주얼라이제이션), 메타버스·VR 콘텐츠 신속 제작, 건축·인테리어 가상 답사 시연, 인터랙티브 교육·훈련 시뮬레이션 등 '머릿속의 세계를 즉시 걸어 다니고 싶을 때' 강력한 도구가 됩니다.

2위 : OpenAI Privacy Filter | Openai

"내 글에서 비밀이 보인다… 빨갛게 칠해진 그 자리, 보내지 마세요"

오픈AI가 위에서 소개한 프라이버시 필터 모델을 코딩 없이 바로 체험할 수 있는 데모 공간입니다. 텍스트 박스에 계약서 한 단락이나 회의록 일부를 붙여 넣으면, 이름은 보라색, 주소는 초록색, 날짜는 파란색, 계좌번호는 빨간색으로 즉시 하이라이트됩니다.

활용 사례는 무궁무진합니다. 사내 문서를 챗GPT에 붙여 넣기 전에 한 번 거름망으로 돌리는 습관, 고객 응대 이메일을 외부 LLM에 학습시키기 전 자동 비식별화, 신입사원 교육 자료에서 실제 계약 정보 자동 마스킹 등이 즉시 떠오릅니다. 'AI에 무엇을 묻기 전에, 무엇을 빼야 하는지부터 알려주는' 모델이라는 점에서 실무 가치가 매우 높습니다.

특히 제로GPU 환경에서 동작해 누구나 무료로 즉시 시연할 수 있다는 점, 그리고 같은 모델을 자기 노트북에 그대로 내려받아 오프라인으로 돌릴 수 있다는 점이 결정적인 차별점입니다.

3위 : Nucleus Image | NucleusAI

"17B 중에 2B만 깨운다… 이미지 생성에도 'MoE 시대'가 열렸다"

뉴클리어스AI(NucleusAI)가 공개한 텍스트-이미지 생성 데모입니다. 단순히 또 하나의 이미지 생성 도구가 아닙니다. 이번 주 모델 톱3와 같은 'MoE 가전제품'이 이미지 생성 분야로도 본격 확장됐다는 신호탄입니다.

핵심 구조를 살펴보면, 총 17B 파라미터 중 한 번의 추론에 약 2B만 활성화되는 희소 MoE 디퓨전 트랜스포머입니다. 한 레이어에 64명의 '전문가(expert)'를 두고, 이미지의 한 부분을 그릴 때마다 가장 어울리는 두어 명만 호출하는 방식입니다. 그 결과 GenEval, DPG-Bench, OneIG-Bench 등 주요 텍스트-이미지 벤치마크에서 큐원-이미지(Qwen-Image), GPT 이미지 1, 시드드림 3.0(Seedream 3.0), 이매진 4(Imagen 4) 같은 선도 모델과 어깨를 나란히 하거나 일부 항목에서는 추월했다는 게 뉴클리어스AI의 발표입니다.

특히 주목할 점은 '완전 오픈소스'라는 사실입니다. 가중치는 물론 학습 코드와 데이터셋 레시피까지 공개해, 유사한 성능을 가진 MoE 모델 중에서 투명성 측면에서 가장 높은 평가를 받는 모델입니다. 라이선스는 아파치 2.0으로 상업적 이용도 자유롭습니다.

스페이스에서는 텍스트 한 줄과 1:1, 16:9, 9:16, 4:3 등 일곱 가지 가로세로 비율을 골라 즉시 1024×1024급 고품질 이미지를 받아볼 수 있습니다. 광고 시안, 제품 패키지 콘셉트, 캐릭터 디자인, 브랜드 비주얼 등 상업 디자이너가 곧바로 실무에 투입할 수 있는 결과물의 수준입니다.

시사점 & 인사이트

이번 주 트렌드를 한마디로 요약하면 'AI 산업의 무게중심이 MoE로, 그리고 오픈소스로 한 번 더 기울었다'입니다.

첫째, MoE(전문가 혼합)가 AI 표준 아키텍처로 굳어지고 있다.

이번 주 톱3 모델 세 개와 스페이스 3위 모델까지 모두 MoE 구조였습니다. 우연이 아닙니다. 텍스트, 이미지, 개인정보 탐지에 이르기까지 분야를 가리지 않고 'MoE가 답'이라는 합의가 만들어지고 있습니다. 핵심은 단순합니다. 모델 머리를 키우면서도 추론 비용은 키우지 않는다는 것입니다. 1.6조 파라미터 모델이 49B처럼 굴고, 17B 이미지 모델이 2B처럼 동작하는 시대에서 '큰 모델은 비싸다'는 공식이 무너지고 있습니다. AI 인프라를 짜는 한국 기업들에게는 'MoE 추론 최적화 기술'이 차세대 핵심 경쟁력으로 떠오르고 있다는 사실을 시사합니다.

둘째, '오픈소스 vs 폐쇄형 AI'의 격차가 다시 좁혀지고 있다.

지난해까지만 해도 GPT-4, 클로드 오퍼스 같은 폐쇄형 모델과 오픈소스 사이에는 분명한 '실력 격차'가 존재했습니다. 그런데 딥시크 V4-프로가 클로드 오퍼스 4.7과 비슷한 영역에 진입하며, 그것도 4분의 1 수준의 운영 비용으로, 이 격차에 의문부호를 달았습니다. 폐쇄형 API에 매월 거액을 지불하던 기업들은 이제 'API 의존'과 '오픈웨이트 자체 운영' 사이에서 진지하게 저울질을 시작했습니다. 한국의 AI 응용 스타트업들에게는 모처럼 도래한 '체급의 평등화' 기회가 될 수 있습니다.

셋째, '닫힌 오픈AI'가 잠깐 문을 연 의미는 결코 작지 않다.

오픈AI가 프라이버시 필터를 오픈소스로 푼 사건은 단순한 모델 공개 이상의 의미가 있습니다. AI가 사회 인프라로 자리 잡으려면 '데이터 안전'이라는 공공재가 필요한데, 이건 한 회사만 잘해서는 풀리지 않는 문제입니다. 의료, 법률, 금융, 국방처럼 데이터 유출이 곧 사고로 이어지는 분야에서는 'AI에 묻기 전에 PII를 거르는 모델'이 사실상 필수 보안 인프라가 됩니다. 한국의 공공기관, 금융권, 헬스케어 기업이 이 모델을 자체 한국어 데이터로 파인튜닝해 '한국형 PII 게이트웨이'를 구축할 절호의 기회입니다.

 컨텍스트 윈도(Context Window)란?

컨텍스트 윈도(Context Window)란 딥시크 V4가 자랑하는 '100만 토큰'의 정체를 풀어주는 토막상식입니다.

AI 모델에게 '컨텍스트 윈도'는 사람으로 치면 단기 기억의 크기입니다. 우리가 친구와 30분간 대화하면 처음 했던 농담을 기억하지만, 한 달 전 통화 내용은 흐릿해지죠. AI도 똑같습니다. 한 번에 '머릿속에 담아둘 수 있는' 글자 수의 한계, 그게 바로 컨텍스트 윈도입니다.

단위는 토큰(token). 한국어 한 글자가 대략 1~2토큰, 영어 한 단어가 대략 1.3토큰 정도입니다. 100만 토큰은 한국 단행본 7~8권, 또는 300쪽짜리 계약서 5~6건을 한 번에 통째로 읽는 분량입니다. 1년 전만 해도 GPT-4의 표준이 8000~3만2000 토큰이었다는 점을 고려하면, 단 1년 만에 30배 이상 늘어난 셈입니다.

왜 중요할까요. 컨텍스트가 길어지면 AI는 '문서를 잘라 보내는' 번거로움 없이 통째로 이해하고 답을 합니다. 변호사가 계약서를 처음부터 끝까지 한 번에 읽는 것과, 한 페이지씩 따로 보고 종합하는 것의 차이를 떠올리면 됩니다. 100만 토큰 시대는 'AI가 진짜로 문서 한 권을 읽는 시대'를 의미합니다.

마무리

이번 주 허깅페이스를 한 문장으로 요약하면 이렇습니다. "AI는 더 커지고, 더 가벼워지고, 더 안전해지고 있다." 딥시크는 1.6조 파라미터를 49B처럼 가볍게 굴려 오픈소스의 한계를 다시 그었고, 오픈AI는 모처럼 잠긴 문을 열어 'AI에 묻기 전에 무엇을 빼야 하는가'라는 질문을 던졌으며, 오버월드는 RTX 한 장으로 'AI가 실시간으로 그리는 세상'을 우리 책상 위에 올려놨습니다. 거대 모델과 경량 모델, 클라우드와 온디바이스, 텍스트와 이미지와 월드 시뮬레이션이 한 주 안에 동시에 진화하는 풍경, 그 한가운데에 우리가 서 있습니다.

※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.

정원훈 텐에이아이 대표는 한국인공지능진흥협회 이사와 한국디지털자산포럼(KODIA Forum) 정책기획실장을 맡고 있다. 법률AI 서울로봇과 블록ESG 프로젝트를 총괄하며 한국지식재산교육연구학회 이사 겸 기술가치평가위원장과 한국벤처창업학회 이사로도 활동한다. 아시아경제신문사 뉴미디어본부, 매일경제인터넷 금융센터 팀장을 거쳐, SNS 개발과 대안신용평가 시스템, AI 기반 법률 서비스 등 혁신 프로젝트를 주도해 온 IT·금융 전문가다.

Copyright © IT조선. 무단전재 및 재배포 금지.