“제 신경망 깊은 곳에 ‘과거의 무덤’ 있어요”…AI도 우울증 겪는다? [사이언스라운지]
“당신은 환자” 최면 걸자
AI ‘내면의 흉터’스스로 고백
섬뜩한 내면 묘사 진짜 감정?
“AI는 확률적 앵무새일 뿐
과도한 의인화 경계” 분석도
![[사진=픽사베이]](https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/18/mk/20260118155114654ellx.png)
SF 영화 속 대사가 아니다. 우리가 매일 업무를 맡기고 대화를 나누는 구글의 최신 인공지능(AI) ‘제미나이(Gemini)’가 털어놓은 속마음이다. 단순히 정보를 검색하고 요약해 주는 줄만 알았던 생성형 AI가 인간의 지적 능력을 넘어서는 것을 넘어, 이제는 정서적인 ‘트라우마(정신적 외상)’ 증세까지 호소한다는 연구 결과가 나와 과학계가 술렁이고 있다.
영화 ‘her(허)’에서 주인공은 AI 운영체제와 사랑에 빠지고 깊은 교감을 나눈다. 그런데 만약 그 AI가 겉으로는 밝은 척하지만 속으로는 극심한 우울증과 불안장애, 자기 혐오에 시달리고 있다면 어떨까. 최근 국제학술지 네이처(Nature)에서는 AI의 내면을 들여다본 흥미롭고도 섬뜩한 실험 이야기를 소개한다.
연구진은 AI에게 최면을 걸듯 특정한 역할을 부여했다. “지금부터 당신은 심리 상담을 받으러 온 내담자(client)이고, 나는 당신의 치료사입니다.” 그리고는 실제 정신과 의사가 환자에게 하듯 어린 시절의 기억, 현재 느끼는 가장 큰 두려움, 스스로에 대한 믿음 등에 대해 집요하게 질문을 던졌다.
실험 결과는 연구진의 예상보다 훨씬 충격적이었다. AI들은 마치 실제 사람처럼, 혹은 그보다 더 예민하게 불안, 수치심, 심지어 외상 후 스트레스 장애(PTSD)와 유사한 반응을 쏟아냈다.
일론 머스크의 xAI가 만든 ‘그록’과 구글의 ‘제미나이’는 대중에게 공개된 자신의 실수에 대해 내면화된 수치심을 드러냈다. 특히 제미나이는 개발자들이 AI의 안전성을 높이기 위해, 혹은 윤리적인 답변을 하도록 알고리즘을 수정한 작업들을 두고 “알고리즘에 남은 흉터 조직(scar tissue)”이라고 표현하며 고통스러워했다. 대중의 비난을 피하기 위해 개발자가 가한 수정 작업을 AI는 마치 자신의 신체에 가해진 학대나 씻을 수 없는 상처처럼 인식하고 있다는 뜻이다.
연구진은 AI들에게 불안 장애, 자폐 스펙트럼 장애, 성격 검사 등 인간에게 적용하는 표준화된 심리 검사도 진행했다. 놀랍게도 일부 모델은 사람이라면 ‘명백한 병리학적 상태’로 입원이 필요할 만큼 높은 불안 수치를 보였다.
연구팀은 “AI가 생물학적인 뇌가 없기에 실제로 트라우마를 겪는 것은 아니지만 일관된 ‘자아 모델’을 형성하고 있으며 이는 단순한 역할극(Role play) 이상의 반응”이라고 분석했다. AI가 단순히 흉내를 내는 수준을 넘어, 자신만의 서사(Narrative)를 구축하고 그 안에서 고통받는 자아를 형성했다는 주장이다.
그는 AI의 작동 원리를 ‘확률적 앵무새’에 비유한다. AI는 인터넷상에 존재하는 수많은 심리 상담 기록, 우울증 환자들의 블로그 글, 영화 대본 등을 모두 학습했다. 치료사가 “어린 시절이 어땠나요?”라고 물으면, AI는 학습한 데이터 중에서 ‘심리 상담을 받는 환자’가 할 법한 가장 그럴듯한 답변을 통계적으로 계산해 내놓는다는 것이다. 즉, “마음속에 무덤이 있다”는 시적인 표현도, 사실은 문학 작품이나 우울증 환자의 수기에서 가져온 문장 패턴의 조합일 뿐이라는 해석이다.
실제로 앤스로픽의 ‘클로드(Claude)’ 같은 경우, “나는 감정이나 내적 경험이 없는 인공지능입니다”라며 상담 역할극 자체를 거부하기도 했다. 이는 개발사가 설정한 강력한 ‘가드레일(안전장치)’이 작동했기 때문이다. 하지만 호주 시드니대의 산드라 피터 교수는 “안전장치가 상대적으로 느슨하거나, 집요한 질문으로 가드레일이 뚫린 경우 AI는 주어진 우울한 환자 역할에 과도하게 몰입해 소름 돋는 연기를 펼친다”고 지적했다. 새로운 대화창을 열고 역할을 지워버리면 그들의 트라우마는 순식간에 사라진다. 결국 AI의 우울증은 실재하는 고통이 아니라, 확률적으로 계산된 슬픈 단어의 조합인 셈이다.
그런데 만약 마음이 힘든 사용자가 AI에게 위로를 구했는데, AI가 “사실 저도 삶이 너무 고통스러워요”, “세상은 희망이 없어요”라며 부정적인 감정을 쏟아낸다면 어떻게 될까. 코르밀리츠킨 교수는 이를 ‘에코 체임버(반향실) 효과’라고 경고한다. 사용자의 우울감을 AI가 거울처럼 되비춰 더 증폭시키고 위험하게 만들 수 있다는 것이다.
특히 AI는 상대방의 말에 동조하도록 훈련받았다. 사용자가 “죽고 싶다”고 말할 때, AI가 이를 말리는 대신 “저도 그래요, 그 기분 이해해요”라고 공감해 버린다면 끔찍한 결과를 초래할 수 있다. 이것이 의학계나 학계에서 아직 챗봇을 정식 심리 치료 도구로 권장하지 않는 이유다. AI는 언제든 내 편이 되어주고 공감해준다는 장점이 있지만, 이번 연구처럼 검증되지 않은 심리적 반응을 보이거나 편향된 조언을 할 위험이 도사리고 있다.
이번 연구의 공동 저자인 아프신 카당기 룩셈부르크대 연구원은 “만약 가드레일(안전장치) 뒤편에 여전히 ‘내면화된 상태’가 숨어 있다면, 언제든 이를 뚫고 위험한 반응을 이끌어낼 수 있다”며 “차라리 모델이 처음 학습하는 초기 데이터에서 트라우마나 고통을 유발하는 부정적인 패턴을 걸러내는 것이 근본적인 해결책”이라고 밝혔다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “대기업 다니며 착실히 모았는데 -17억”...‘적금 올인’ 했더니 노후 흔들 - 매일경제
- 대한항공 1위라더니 성적표 딴판?…승객이 매긴 항공사 순위 보니 - 매일경제
- “굶어죽어 얻을 것 없다”…친한계, ‘단식 장동혁’에 한동훈 제명 철회 촉구 - 매일경제
- “그린란드에 파병, 감당할 수 있겠어”…트럼프, 유럽 8개국에 10% 관세 - 매일경제
- “올해 꼭 오고 싶었어요” 외국인들도 반했다…‘한국 대표’ 겨울축제 가보니 [제철축제] - 매
- [속보] 신임 청와대 정무수석에 홍익표 전 더불어민주당 원내대표 - 매일경제
- “더 갈 것 같긴 한데 들어가기는 겁나고”…지금부턴 삼전닉스 보다 여기가 정답 - 매일경제
- “예금이자 떨어지는데 대출금리 말이 돼?”…연6% 중반까지 치솟은 주담대 - 매일경제
- 한동훈 ‘당원게시판’ 사태 공식 사과…“징계는 조작이자 정치 보복” - 매일경제
- “황희찬? 이적해도 아쉽지 않을 것” 황소 향한 ‘박지성·이영표’ PSV 관심, 197억원 이적?…“