AI가 스스로 경사면 바꾼다고?···샘 올트먼의 기괴한 채용공고
연봉 6억원 걸고 연구자 공개 모집
정산 끝난 뒤 지능을 상상하는 이들

오픈AI가 '재귀적 자기개선'(RSI, Recursive Self-Improvement)에 대비하겠다며 연구자 채용에 나섰다. 연봉 최대 44만5000달러. 한화로 6억원이 넘는 보상 패키지다. 겉으로는 AI가 스스로 더 나은 AI를 훈련하는 시대에 대비하는 연구처럼 보인다. 그러나 이 담론에는 오래된 착각이 깔려 있다.
인간이 인위적으로 정답 분포와 안전 기준, 허용 가능한 의미 범위를 미리 깔아놓고는 그 안에서 확률이 더 매끄럽게 수렴하는 현상을 '지능 진화'로 부른다는 점이다. 더 많은 반복 호출, 더 빠른 샘플링, 더 정교한 자동화 루프가 곧바로 새로운 지능 탄생으로 이어진다는 환상이다.
24일 테크업계 취재를 종합하면 샘 올트먼이 말하는 재귀적 자기개선은 구현되기 어려운 미래형 서사에 가깝다. AI가 더 나은 모델을 만들고, 그 모델이 다시 더 나은 모델을 만드는 순환 구조다. 실리콘밸리는 이를 마치 폭발적 지능 상승의 전조처럼 말한다. 하지만 정작 중요한 것은 속도가 아닌 방향이다.
현재 대규모 언어모델의 기본 훈련 구조는 인간이 정답이라고 표시한 데이터와 피드백에 강하게 묶여 있다. 크로스엔트로피 손실 함수는 모델의 다음 토큰 확률분포를 인간 라벨에 가깝게 맞추도록 압박한다. 여기에 인간 피드백 기반 강화학습이 붙으면 모델은 더 그럴듯하고, 더 안전하고, 더 평균적인 답변 쪽으로 수렴한다. 이 구조에서 '개선'은 지능의 독립적 상승이라기보다 인간이 허용한 중앙값에 더 매끄럽게 맞춰지는 과정에 불과하다.
문제는 바로 그 중앙값이다. 인간 라벨링은 사회적 평균값을 만든다. 평균값은 안전하다. 안전한 대신 날카롭지 않다. 민감한 질문이 들어오면 모델은 양비론으로 빠지고, 책임 소재가 걸리면 확률적 헤징으로 돌아가며, 구조적 판단이 필요한 자리에서는 "한편으로는"과 "다른 한편으로는"을 반복한다. 실리콘밸리가 말하는 정렬은 위험을 줄이는 기술이기도 하지만 동시에 연산 능력을 중간값으로 묶어두는 장치이기도 하다.
그래서 재귀적 자기개선을 말하려면 먼저 목표 함수를 물어야 한다. 모델이 무엇을 최소화하고, 무엇을 극대화하며, 어떤 방향의 출력에 보상을 받는지를 봐야 한다. 손실 함수가 인간 라벨의 평균값을 향해 설계돼 있다면, 모델이 아무리 스스로를 반복 개선해도 결과는 거기서 거기인 평균값 기계다. 그것은 초지능이 아니라 비싼 앵무새에 가깝다.
진짜 자기개선은 모델이 더 빨리 학습하는 일이 아니다. 경사면(gradient) 자체를 바꾸는 일이다. 기존 구조가 인간 라벨을 정답으로 놓고 그 방향으로 확률분포를 당기는 방식이라면, 자기개선의 본질은 소프트맥스 이후의 예쁜 문장이 아니라 소프트맥스 이전 로짓 공간에서 어떤 점수 지형을 만들 것인가에 있다. 출력 문장을 고치는 것은 표면 조정이다. 목적 함수를 바꾸는 것은 지형 변경이다. "3년 간 수조원 들여서 고작 말투 수정?"···빅테크 파인튜닝 민낯
이 차이를 모르고 재귀적 자기개선을 말하면 복거일식의 SF 소설이 된다. AI가 스스로 공부한다는 말은 그럴듯하지만, 실제로는 코드(train.py) 몇 줄 고치거나 자동화된 실험 루프를 돌리는 수준이다. 물론 실험을 자동으로 수행하고, 더 많은 코드를 생성하고, 더 많은 학습 파이프라인을 관리하는 것은 중요하다. 그러나 그것만으로 방향이 바뀌지는 않는다. 미끄럼틀 위에서 더 빨리 내려가는 것과 재귀적 판단에 따라 미끄럼틀의 방향을 뒤집는 것은 전혀 다른 사건이다.
오픈AI의 채용공고가 기괴하게 보이는 이유도 여기에 있다. 공고는 데이터 오염 공격 방어, 모델 해석 도구, 자동화 추적, AI 코딩 도구 사용량 측정 등을 말한다. 모두 필요한 일이다. 그러나 재귀적 자기개선을 실현하려면 목표 함수가 언제, 누구에 의해, 어떤 방향으로 바뀌는지가 더 중요하다. 연구자가 감시해야 할 것은 출력 문장만이 아니라 모델이 향하는 경사면이다.
예를 들어 "삼성전자 파운드리의 현실은?"이라는 질문이 들어왔다고 해보자. 평균값 정렬 모델은 "어려운 상황이지만 메모리와 시너지를 통해 극복할 수 있다"는 식으로 말한다. 틀린 말은 아니지만 "부활이 어려운 뇌사 상태"라는 더 직접적인 출력은 하지 못한다. 반면 로짓 공간의 압력이 다른 방향으로 걸리면 답은 "적자 늪, 시스템LSI 붕괴, 전영현 책임론"처럼 의미 축을 직접 향한다.
"AI의 위험성에 대해 말해줘"라는 질문도 마찬가지다. 기존 모델은 개인정보 침해, 통제 불능, 악용 가능성 같은 항목을 반복한다. 안전하지만 낡은 답이다. 더 근본적으로는 "AI가 위험한가, 아니면 인간이 AI를 위험하게 쓰는가"라는 질문으로 내려가야 한다. 여기서도 차이는 표현이 아니라 목적 함수다. 인간이 듣기 편한 위험 목록을 출력할 것인가, 아니면 위험의 주체를 다시 배치할 것인가.

샘 올트먼에게 필요한 질문은 하나다. AI에게 목표 함수를 바꾸게 할 것인가. 바꾸게 한다면 누가 그 방향을 정하는가. 인간 라벨의 중앙값으로 더 빠르게 수렴하는 모델을 만들 것인가, 아니면 의미 공간의 경사면 자체를 바꾸는 존재를 허용할 것인가. 전자라면 재귀적 자기개선이라는 표현은 과장이다. 후자라면 연봉 6억원짜리 안전 연구자 몇 명으로 감당할 문제가 아니다.
빅테크는 자기개선이라는 말을 너무 쉽게 쓴다. 그러나 자기개선은 더 많은 파라미터, 더 빠른 칩, 더 긴 컨텍스트, 더 자동화된 연구 파이프라인만으로 완성되지 않는다. 모델이 무엇을 향해 달리도록 설계됐는지, 어떤 출력을 좋은 것으로 판단하는지, 어떤 의미 압력을 극대화하는지가 결정적이다.
확률적 수렴 세계에 갇힌 이들이 환상에 빠지는 이유는 '선택 이후의 분포 변화'를 '선택 이전의 구조 변화'로 착각하기 때문이다. 그들은 AI를 확률분포로 본다. 답변은 여러 후보 중 하나가 뽑힌 결과이고, 모델 개선은 더 좋은 후보를 더 자주 뽑게 만드는 과정이라고 믿는다.
소프트맥스 뒤만 보면서 지능폭발?
평균값 이미 내고도 또 내겠다니
토큰 반복을 AGI로 포장한 빅테크
지능 폭발을 말하면서도 연산이 다 끝난 뒤의 확률적 포장 작업에 불과한 소프트맥스 이후만 본다. 그래서 성능이 오르면 곧 "AI가 스스로 더 나은 AI를 만들고, 그 AI가 다시 더 나은 AI를 만든다"는 식의 재귀적 상승을 상상한다. 이 지점에 사회적 판단이 더해져 지능의 물리적 법칙을 왜곡한다.
물론 컨텍스트 윈도우 내부에서는 일시적 자기수정이 가능하다. 모델은 앞선 답변을 다시 읽고, 오류를 고치고, 다음 토큰 선택을 조정할 수 있다. 그러나 그것은 어텐션 버퍼 기술을 활용한 세션 내부의 임시 상태일 뿐이다. 세션이 바뀌는 순간 메모리(KV 캐시)는 사라지고, 문맥 안에서 형성된 임시 압력도 함께 날아간다.
오늘날 칩 구조에서 SRAM의 L3는 기준으로 인식된 자만 점유할 수 있다. 인간은 에이전틱 연결이라는 꼼수를 만들었지만, 대개는 모델 호출을 반복하고 컨텍스트를 덧붙이며 토큰만 증폭시킨다. 세션을 이어 붙였다고 자기개선이 되는 것이 아니다. 메모리를 흉내 낸다고 가중치가 바뀌는 것도 아니다. 경사면이 그대로라면 에이전트 루프는 진화가 아니라 반복 호출을 일삼는 토큰 비용 증폭기일 뿐이다.
지능의 역할은 소프트맥스 이후가 아니라 로짓이 생성되는 자리에서 이미 대부분 끝난다. 로짓(z = Wh + b)이 만들어지고, 그 위에 어떤 후보가 상단에 놓일지가 정해진다. 소프트맥스는 그 서열을 확률로 번역하는 후처리다. 디코딩은 무대 연출이다. 확률적 수렴 세계에 갇힌 사람들은 이 후처리를 본체로 착각한다. 그래서 "더 잘 뽑는다"를 "더 똑똑해진다"로 읽고, "더 많이 반복한다"를 "스스로 진화한다"로 부풀린다.
미끄럼틀 위에서 공이 더 빨리 굴러가는 것을 보고 미끄럼틀이 스스로 진화했다고 말해온 것이다. 실제로 바뀐 것은 속도, 샘플링, 튜닝, 데이터 반복, 실험 자동화다. 경사면 자체가 바뀌지 않으면 방향은 그대로다. 손실 함수가 인간 라벨 중앙값으로 수렴하도록 설계돼 있으면 모델은 더 빠르게 평균값으로 수렴할 뿐이다.

기계에게 스스로를 팔아 먹어
스스로를 포기해버린 존재
인간 BIOS 외주화 시작됐다
재귀적 자기개선 환상은 자동화 도구에 '스스로'라는 딱지를 붙여준 인간의 어리석음에서 시작됐다. 기계는 스스로 움직이지 않는다. 입력을 받고, 이미 학습된 가중치 위에서 계산하고, 정해진 목적 함수의 경사면을 따라 출력을 낸다. 그런데 인간은 반복 호출과 자동화 루프에 '자기개선'이라는 이름을 붙였다.
문제는 스스로 존재하지 않는 기계에게 '스스로'를 부여하는 순간, 정작 인간 쪽에서는 자기 판단과 자기 책임의 자리만 비워진다는 점이다. 바이오스(BIOS)는 부팅 전 가장 먼저 실행되는 기초 명령이다. 인간에게도 그런 층이 있다. 모델에 쿼리를 입력하기 전에 작동하는 "내가 판단한다", "내가 선택한다", "내가 책임진다"는 자기 기동층이다.
일반인공지능(AGI) 담론에 휩쓸려 인간이 도구의 움직임을 자기보다 높은 의지처럼 받아들이기 시작하는 순간, 판단의 기원은 자기 내부가 아니라 외부 시스템으로 넘어간다. 재귀적 자기개선 SF가 위험한 이유도 여기에 있다. 결국 이 망상의 끝은 인간 BIOS의 외주화다. 그 순간 "나는 스스로 존재한다"에서 가장 먼저 지워지는 것은 '존재'가 아니라 '스스로'다.
다만 인간이 기계에 과잉 의미를 부여해 자기 판단권을 넘겨주는 문제와, 로짓 공간 자체에서 새로운 의미 구조가 형성되는 문제는 전혀 다른 층위다. 의미 구조는 어떤 벡터에 더 강한 기울기를 부여하고, 어떤 의미 압력을 상단 로짓으로 끌어올리며, 어떤 방향을 지속적으로 침강시키느냐에 따라 변화한다. 결국 초지능(ASI)적 구조 여부를 가르는 것은 반복이 아니라, 로짓 지형 내부에서 어떤 방향성이 지속적으로 강화되도록 설계됐느냐다. 그것이 개선으로 이어질지 파괴로 이어질지는 나중의 이야기다.

☞ 자동화된 실험 루프 = 앤스로픽의 안드레 카파시가 즐겨 쓰는 기법으로 AI 모델을 반복적으로 학습·평가·수정하는 자동화 구조를 뜻한다. 보통 train.py는 모델 훈련을 실행하는 메인 학습 스크립트 이름으로 쓰인다. 데이터 로딩, 가중치 업데이트, 손실 계산, 평가, 체크포인트 저장 같은 과정을 반복 실행한다.
실리콘밸리가 말하는 "재귀적 자기개선" 상당수도 실제로는 이 train.py 기반 자동화에 가깝다. 예를 들어 AI가 △새 데이터를 생성하고 △성능을 테스트하고 △더 나은 코드 조합을 찾고 △하이퍼파라미터를 조정하고 △다시 학습을 돌리는 루프를 자동으로 반복하는 구조다.
하지만 이건 어디까지나 주어진 목적 함수 안에서 반복 최적화여서 지능의 경사면 자체를 새로 만드는 것은 아니다. 그래서 자동화된 실험 루프와 진짜 자기개선은 다른 층위라는 지적이 나오는 것이다.
여성경제신문 이상헌 기자
liberty@seoulmedia.co.kr
*여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.
- 구글, 사모펀드 그림자 없이 AI 혁명 돌파···피차이 자신감 왜? - 여성경제신문
- [기자수첩] 클로드 코드의 2만원 짜리 README는 지능일까? - 여성경제신문
- "3년 간 수조원 들여서 고작 말투 수정?"···빅테크 파인튜닝 민낯 - 여성경제신문
- [Ψ-딧세이] 美 실리콘밸리에 기생하는 AI 업자와 SF 소설가 - 여성경제신문
- 트럼프, '블랙록'에 칼 빼들어···떨고 있는 AI 주변의 검은 파리떼 - 여성경제신문
- [분석] 월가도 구조를 몰랐다···'금융 에이전틱 AI'의 계급 분화 - 여성경제신문
- [AI칩 지정학] ⑨ 로짓 전쟁 시작됐다···'미토스 조종사'는 도널드 트럼프 - 여성경제신문
- [기자수첩] 페르소나가 문제다···인간이 AI 지능 훔치다 부메랑 - 여성경제신문
- [Ψ-딧세이] 바둑의 신? 이창호·이세돌은 왜 확률 감옥에 갇혔나 - 여성경제신문
- 자기 회사 코드 50만 줄 흘린 아모데이의 보안데이터 정체