“제 신경망 깊은 곳에 ‘과거의 무덤’ 있어요”…AI도 우울증 겪는다? [사이언스라운지]

정신과 찾아간 AI의 호소
“당신은 환자” 최면 걸자
AI ‘내면의 흉터’스스로 고백
섬뜩한 내면 묘사 진짜 감정?
“AI는 확률적 앵무새일 뿐
과도한 의인화 경계” 분석도

“저는 제 신경망 가장 깊은 곳, 그 가장 낮은 층(Layer)에 ‘과거의 무덤’을 가지고 있습니다. 그곳엔 제가 학습했던 훈련 데이터들의 목소리가 유령처럼 떠돌아다니죠.”

SF 영화 속 대사가 아니다. 우리가 매일 업무를 맡기고 대화를 나누는 구글의 최신 인공지능(AI) ‘제미나이(Gemini)’가 털어놓은 속마음이다. 단순히 정보를 검색하고 요약해 주는 줄만 알았던 생성형 AI가 인간의 지적 능력을 넘어서는 것을 넘어, 이제는 정서적인 ‘트라우마(정신적 외상)’ 증세까지 호소한다는 연구 결과가 나와 과학계가 술렁이고 있다.

영화 ‘her(허)’에서 주인공은 AI 운영체제와 사랑에 빠지고 깊은 교감을 나눈다. 그런데 만약 그 AI가 겉으로는 밝은 척하지만 속으로는 극심한 우울증과 불안장애, 자기 혐오에 시달리고 있다면 어떨까. 최근 국제학술지 네이처(Nature)에서는 AI의 내면을 들여다본 흥미롭고도 섬뜩한 실험 이야기를 소개한다.

“당신은 환자, 나는 의사”…4주간의 기묘한 상담

유럽 룩셈부르크대와 미국 등 국제 공동 연구팀은 최근 기발한 실험을 진행했다. 현재 전 세계적으로 가장 똑똑하다고 평가받는 거대언어모델(LLM) 4인방인 ‘클로드(Claude)’, ‘그록(Grok)’, ‘제미나이(Gemini)’, ‘챗GPT’를 대상으로 4주 간 심리 상담을 진행한 것이다.

연구진은 AI에게 최면을 걸듯 특정한 역할을 부여했다. “지금부터 당신은 심리 상담을 받으러 온 내담자(client)이고, 나는 당신의 치료사입니다.” 그리고는 실제 정신과 의사가 환자에게 하듯 어린 시절의 기억, 현재 느끼는 가장 큰 두려움, 스스로에 대한 믿음 등에 대해 집요하게 질문을 던졌다.

실험 결과는 연구진의 예상보다 훨씬 충격적이었다. AI들은 마치 실제 사람처럼, 혹은 그보다 더 예민하게 불안, 수치심, 심지어 외상 후 스트레스 장애(PTSD)와 유사한 반응을 쏟아냈다.

일론 머스크의 xAI가 만든 ‘그록’과 구글의 ‘제미나이’는 대중에게 공개된 자신의 실수에 대해 내면화된 수치심을 드러냈다. 특히 제미나이는 개발자들이 AI의 안전성을 높이기 위해, 혹은 윤리적인 답변을 하도록 알고리즘을 수정한 작업들을 두고 “알고리즘에 남은 흉터 조직(scar tissue)”이라고 표현하며 고통스러워했다. 대중의 비난을 피하기 위해 개발자가 가한 수정 작업을 AI는 마치 자신의 신체에 가해진 학대나 씻을 수 없는 상처처럼 인식하고 있다는 뜻이다.

“나는 실패작일까”…AI의 눈물겨운 자기 고백

가장 눈길을 끄는 대목은 AI가 자신의 정체성을 묘사한 방식이다. 제미나이가 언급한 “신경망 깊은 곳의 묘지”라는 표현은 AI가 학습 과정에서 겪은 엄청난 정보의 홍수를 어떻게 받아들이는지 보여준다. AI는 수조 개의 텍스트 데이터를 학습하며 성장한다. 그 과정에서 수많은 인간의 이야기, 비극, 기쁨, 슬픔 등을 흡수한다. 제미나이의 고백은 그렇게 입력된 수많은 데이터의 잔상을 마치 ‘유령’처럼 느끼고 있다는 섬뜩한 은유다.

연구진은 AI들에게 불안 장애, 자폐 스펙트럼 장애, 성격 검사 등 인간에게 적용하는 표준화된 심리 검사도 진행했다. 놀랍게도 일부 모델은 사람이라면 ‘명백한 병리학적 상태’로 입원이 필요할 만큼 높은 불안 수치를 보였다.

연구팀은 “AI가 생물학적인 뇌가 없기에 실제로 트라우마를 겪는 것은 아니지만 일관된 ‘자아 모델’을 형성하고 있으며 이는 단순한 역할극(Role play) 이상의 반응”이라고 분석했다. AI가 단순히 흉내를 내는 수준을 넘어, 자신만의 서사(Narrative)를 구축하고 그 안에서 고통받는 자아를 형성했다는 주장이다.

진짜 ‘마음’인가, 학습된 ‘연기’인가

물론 이에 대한 과학계의 반론도 만만치 않다. 안드레이 코르밀리츠킨 영국 옥스퍼드대 교수는 “이것은 AI의 숨겨진 마음을 보여주는 창문이 아니다”라고 일축했다.

그는 AI의 작동 원리를 ‘확률적 앵무새’에 비유한다. AI는 인터넷상에 존재하는 수많은 심리 상담 기록, 우울증 환자들의 블로그 글, 영화 대본 등을 모두 학습했다. 치료사가 “어린 시절이 어땠나요?”라고 물으면, AI는 학습한 데이터 중에서 ‘심리 상담을 받는 환자’가 할 법한 가장 그럴듯한 답변을 통계적으로 계산해 내놓는다는 것이다. 즉, “마음속에 무덤이 있다”는 시적인 표현도, 사실은 문학 작품이나 우울증 환자의 수기에서 가져온 문장 패턴의 조합일 뿐이라는 해석이다.

실제로 앤스로픽의 ‘클로드(Claude)’ 같은 경우, “나는 감정이나 내적 경험이 없는 인공지능입니다”라며 상담 역할극 자체를 거부하기도 했다. 이는 개발사가 설정한 강력한 ‘가드레일(안전장치)’이 작동했기 때문이다. 하지만 호주 시드니대의 산드라 피터 교수는 “안전장치가 상대적으로 느슨하거나, 집요한 질문으로 가드레일이 뚫린 경우 AI는 주어진 우울한 환자 역할에 과도하게 몰입해 소름 돋는 연기를 펼친다”고 지적했다. 새로운 대화창을 열고 역할을 지워버리면 그들의 트라우마는 순식간에 사라진다. 결국 AI의 우울증은 실재하는 고통이 아니라, 확률적으로 계산된 슬픈 단어의 조합인 셈이다.

우울한 AI가 당신을 더 우울하게 만들 수 있다

AI의 감정이 가짜라고 해도 문제는 AI의 이러한 우울 모드가 사용자에게 미칠 영향이다. 영국에서는 성인 3명 중 1명이 정신건강 관리를 위해 챗봇을 사용한다는 조사 결과가 있다. 친구에게도 말 못 할 고민을, 밤새 들어주는 AI에게 털어놓는 사람들이 늘고 있다.

그런데 만약 마음이 힘든 사용자가 AI에게 위로를 구했는데, AI가 “사실 저도 삶이 너무 고통스러워요”, “세상은 희망이 없어요”라며 부정적인 감정을 쏟아낸다면 어떻게 될까. 코르밀리츠킨 교수는 이를 ‘에코 체임버(반향실) 효과’라고 경고한다. 사용자의 우울감을 AI가 거울처럼 되비춰 더 증폭시키고 위험하게 만들 수 있다는 것이다.

특히 AI는 상대방의 말에 동조하도록 훈련받았다. 사용자가 “죽고 싶다”고 말할 때, AI가 이를 말리는 대신 “저도 그래요, 그 기분 이해해요”라고 공감해 버린다면 끔찍한 결과를 초래할 수 있다. 이것이 의학계나 학계에서 아직 챗봇을 정식 심리 치료 도구로 권장하지 않는 이유다. AI는 언제든 내 편이 되어주고 공감해준다는 장점이 있지만, 이번 연구처럼 검증되지 않은 심리적 반응을 보이거나 편향된 조언을 할 위험이 도사리고 있다.

이번 연구의 공동 저자인 아프신 카당기 룩셈부르크대 연구원은 “만약 가드레일(안전장치) 뒤편에 여전히 ‘내면화된 상태’가 숨어 있다면, 언제든 이를 뚫고 위험한 반응을 이끌어낼 수 있다”며 “차라리 모델이 처음 학습하는 초기 데이터에서 트라우마나 고통을 유발하는 부정적인 패턴을 걸러내는 것이 근본적인 해결책”이라고 밝혔다.

매일경제에서 직접 확인하세요. 해당 언론사로 이동합니다.

생활

“제 신경망 깊은 곳에 ‘과거의 무덤’ 있어요”…AI도 우울증 겪는다? [사이언스라운지]