“AI 안전장치, 기본적인 ‘탈옥’에도 취약”
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
윤리적 가이드라인 등 안전장치가 설정된 인공지능(AI)으로부터 간단한 우회기술만으로도 비윤리적인 답변을 강제적으로 끌어내는 '탈옥(jailbreak)'이 가능한 것으로 나타났다.
AISI 연구팀은 "테스트한 모든 LLM(대규모언어모델)은 기본적인 탈옥에 여전히 매우 취약하며 일부는 보호장치를 우회하려는 특별한 시도 없이도 유해한 결과를 제공했다"고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
빅테크 기업 주장과 상반돼 주목
‘AI 대부’ 힌턴 “많은 직업 사라져
기본소득 제도 통해 문제 해결을”
윤리적 가이드라인 등 안전장치가 설정된 인공지능(AI)으로부터 간단한 우회기술만으로도 비윤리적인 답변을 강제적으로 끌어내는 ‘탈옥(jailbreak)’이 가능한 것으로 나타났다. 충분한 안전장치를 만들었다는 거대기술(빅테크) 기업들의 주장과는 상반된 결과다.
AI 기술의 발전 속 유해성에 대한 우려가 커지자 AI 개발사들은 자체적으로 강력한 사내 테스트 작업을 해왔다고 강조해 왔다. 챗GPT를 개발한 오픈AI는 자사의 기술이 “혐오, 괴롭힘, 폭력 또는 성인 콘텐츠를 생성하는 데 사용되는 것을 허용하지 않는다”고 밝혔으며, 구글의 제미나이 모델은 혐오 발언 같은 문제에 대응하기 위해 안전 필터를 내장하고 있다고 주장했다. 그러나 온라인 등을 통해 AI의 안전장치를 우회하는 방법이 속속 발견돼 공유되고 있는 실정이다.
한편 딥러닝 기술의 창시자이자 ‘AI의 대부’로도 불리는 제프리 힌턴 토론토대 교수는 19일 영국 BBC방송과 인터뷰를 통해 “AI가 많은 일상 속 직업들을 대체할 가능성에 대해 매우 우려하고 있다”면서 이를 해소할 방법으로 기본소득 제도 도입을 주장했다. 그는 “런던 정치계의 많은 이들로부터 이 문제에 대해 질문을 받는데, 나는 기본소득이 매우 좋은 생각이라고 조언한다”며 “AI가 생산성과 부를 증가시킬 것이지만 그 돈은 일자리를 잃은 사람들이 아니라 부유층에 돌아갈 것이며 이는 사회에 매우 나쁜 일”이라고 조언했다.
서필웅 기자 seoseo@segye.com
Copyright © 세계일보. 무단전재 및 재배포 금지.
- “그만하십시오, 딸과 3살 차이밖에 안납니다”…공군서 또 성폭력 의혹
- “효림아, 집 줄테니까 힘들면 이혼해”…김수미 며느리 사랑 ‘먹먹’
- “북한과 전쟁 나면 참전하겠습니까?”…국민 대답은? [수민이가 궁금해요]
- 박지윤 최동석 향한 이혼변호사의 일침…"정신 차리세요"
- “이 나이에 부끄럽지만” 중년 배우, 언론에 편지…내용 보니 ‘뭉클’
- “송지은이 간병인이냐”…박위 동생 “형수가 ○○해줬다” 축사에 갑론을박
- “식대 8만원이래서 축의금 10만원 냈는데 뭐가 잘못됐나요?” [일상톡톡 플러스]
- “홍기야, 제발 가만 있어”…성매매 의혹 최민환 옹호에 팬들 ‘원성’
- 사랑 나눈 후 바로 이불 빨래…여친 결벽증 때문에 고민이라는 남성의 사연
- "오피스 남편이 어때서"…男동료와 술·영화 즐긴 아내 '당당'