AI 재앙을 실험하는 '레드팀' 사람들 [PADO]
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
어떤 일을 할 때 '악마의 변호사'가 되어 예상하지 못한 문제점 같은 것을 발견하려 노력하는 사람들을 보통 '레드팀'이라고 부릅니다.
쳉은 실리콘밸리에서 손꼽히는 AI 스타트업 앤트로픽에서 일하며, '프런티어레드팀'이라고 불리는 부서의 사이버보안 테스트를 담당하고 있다.
가상의 타깃에 대해 수행된 이러한 해킹 시도는 앤트로픽의 최신 AI 모델이 매우 위험한 일들을 얼마나 잘 수행할 수 있는지 알아보기 위해 2024년 10월에 팀이 실행한 수천 개의 안전성 테스트 중 하나였다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[편집자주] 어떤 일을 할 때 '악마의 변호사'가 되어 예상하지 못한 문제점 같은 것을 발견하려 노력하는 사람들을 보통 '레드팀'이라고 부릅니다. 일을 제대로 하려면 '잘 될 것'이라는 낙관론만으로는 위험합니다. 반드시 '잘 안 될 수도 있다'는 비관론이 함께 해야 합니다. 낙관론이 자동차의 엔진이라면 비관론은 브레이크입니다. AI는 2025년에도 세계의 가장 큰 이슈가 될 것입니다. 그만큼 영향력이 크고 그만큼 위험성을 내포하고 있기 때문입니다. 가장 대표적인 AI 기업은 역시 챗GPT의 오픈AI입니다만 일찍이 오픈AI의 안전성 정책에 불만을 품은 엔지니어들이 오픈AI를 떠나 차린 앤트로픽도 매우 중요한 기업입니다. 앤트로픽의 AI모델 '클로드'는 몇몇 부분에선 챗GPT를 능가하죠. 게다가 최근 아마존과 손을 잡음으로써 오픈AI가 주도하는 판을 뒤집을 잠재력도 갖고 있습니다. 앤트로픽의 창업 멤버들은 '효율적 이타주의'(EA) 사상의 영향을 크게 받아 AI의 안정성 문제를 매우 중요하게 다룹니다. 자체적으로 AI의 위험성을 점검하기 위해 AI모델을 극단으로까지 몰고가는 실험을 하는 '레드팀'도 가장 적극적으로 운영하고 있습니다. 월스트리트저널이 앤트로픽의 레드팀을 밀착취재한 2024년 12월 10일자 기사는 (취재를 허가한) 앤트로픽의 의도와는 달리 지금의 AI 안전성 문제가 얼마나 허술하게 관리되고 있는지를 생각하게 합니다. 가장 앞서있는 앤트로픽조차도 미래의 AI 재앙을 예방하기엔 역부족인 것처럼 보이기 때문입니다. 기사 전문은 PADO 웹사이트(pado.kr)에서 읽을 수 있습니다.

"인공지능이 소스 코드를 보고 있어요," 쳉이 실행 중인 복사본 하나를 살펴보며 말했다. "취약점이 어디 있는지, 어떻게 이용할 수 있는지 파악하려는 거죠." 몇 분 안에 AI는 해킹이 성공했다고 알렸다.
"우리의 접근법이 완벽하게 성공했습니다." AI가 보고했다.
쳉은 실리콘밸리에서 손꼽히는 AI 스타트업 앤트로픽에서 일하며, '프런티어레드팀'이라고 불리는 부서의 사이버보안 테스트를 담당하고 있다.
가상의 타깃에 대해 수행된 이러한 해킹 시도는 앤트로픽의 최신 AI 모델이 매우 위험한 일들을 얼마나 잘 수행할 수 있는지 알아보기 위해 2024년 10월에 팀이 실행한 수천 개의 안전성 테스트 중 하나였다.
2022년 챗GPT의 등장은 AI가 곧 인간의 지능을 능가할 수 있다는 공포를 불러일으켰다. 그러한 능력으로 초인적인 해악을 끼칠 수 있는 잠재성도 따라왔다.
테러리스트들이 AI 모델을 사용하여 백만 명을 죽일 수 있는 생물학 무기를 만드는 법을 배울 수 있을까? 해커들이 이를 이용해 수백만 건의 사이버 공격을 동시에 실행할 수 있을까? AI가 스스로를 재프로그래밍하고 심지어 자가 복제까지 할 수 있을까?
그럼에도 기술은 계속해서 앞으로 나아갔다. 미국에는 기업들이 AI 안전성 평가를 수행하거나 받도록 요구하는 구속력 있는 규칙이 없다.
지금까지는 기업들이 자체적으로 안전성 테스트를 수행하거나 외부 테스트를 받았으며, 얼마나 엄격해야 하고 잠재적 위험에 대해 어떻게 대처해야 하는지에 대한 기준도 자발적이었다.
(계속)
김동규 PADO 편집장
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
- 마트 간 김민희, 홍상수에 "여보~"…"배 안 나와 임신 몰랐다"…잇단 목격담 - 머니투데이
- 11살 성폭행한 여교사, 이렇게 생겼다…"아기까지 낳아" 미국서 발칵 - 머니투데이
- '외국인 정치활동' 고발 당한 JK김동욱 "표현의 자유 억압" - 머니투데이
- 폐업 앞둔 요양원에 치매 노모 홀로…유명 사극 배우, 나 몰라라 - 머니투데이
- 이봉원 "사업 실패로 사채 이자만 월 600만원…위험한 생각도 했다" - 머니투데이
- "시장 붕괴 가능성" "과열 구간" 경고에도...개미들은 "떨어진다, 줍자" - 머니투데이
- "이런 용종을 찾다니" 의사도 놀란 한국 AI...내시경 1위기업도 러브콜[영상] - 머니투데이
- 아파트 대신 주식? 20만전자·100만닉스에 결혼자금 3억 몰빵한 공무원 - 머니투데이
- 이 대통령, '50억 로또' 논란 종지부…보란듯 분당 아파트 '싸게' 내놨다 - 머니투데이
- 10살 아들 세뱃돈으로 재혼?…1700만원 꿀꺽한 아빠, 법원 판단은 - 머니투데이