오픈AI, 작은 모델로 GPT4 감독 성공 “AGI 감시방법론 첫 발”
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈AI(OpenAI)는 슈퍼정렬에 관한 새로운 연구 방향을 15일 발표했다.
이 연구는 딥러닝의 일반화 속성을 이용하여 '약한 감독자'인 인간이 더 강력한 AI 모델을 어떻게 효과적으로 제어할 수 있는지 탐구한다.
연구팀은 이 새로운 연구 방향이 초인간 AI 모델을 경험적으로 정렬하는 데 중요한 발전이 될 것이라고 밝혔다.
이 연구는 '약한 감독자'가 강한 모델을 어떻게 제어할 수 있는지를 탐구하며, 이는 AI의 일반화 능력을 활용한 것이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
연구팀은 GPT-2 수준의 모델을 사용해 GPT-4와 유사한 수준의 감독성능을 달성하는 데 성공했다. 이는 작은 모델이 복잡하고 어려운 문제에서도 올바르게 일반화할 수 있음을 시사한다. 특히 이 방법은 미래의 초지능 AI 시스템을 안전하고 효율적으로 조정하는 데 핵심적인 역할을 할 것으로 기대된다고 회사는 밝혔다.
이번 연구는 또한 인간 피드백 강화 학습(RLHF)과 같은 현재의 정렬 방법들이 가진 한계를 극복하고자 한다. 미래의 AI 시스템은 인간이 이해하기 어려울 만큼 복잡하고 창의적인 행동을 할 수 있기 때문에, 초지능 AI의 안전한 감독과 제어는 매우 중요한 과제다. 연구팀은 이 새로운 연구 방향이 초인간 AI 모델을 경험적으로 정렬하는 데 중요한 발전이 될 것이라고 밝혔다.
오픈AI의 새로운 연구는 인간과 AI 사이의 감독 관계에 초점을 맞추고 있다. 이 연구는 ‘약한 감독자’가 강한 모델을 어떻게 제어할 수 있는지를 탐구하며, 이는 AI의 일반화 능력을 활용한 것이다. 미래에는 인간의 지능이 AI보다 낮을것이라는 전제다.
이는 미래의 초인적 AI 시스템을 정렬하는 데 중요한 단계로, 인간이 AI 시스템을 자신보다 똑똑하게 감독해야 하는 문제를 해결하는 데 도움이 될 것으로 보인다.
현재 인간 피드백 강화 학습(RLHF)과 같은 정렬 방법들은 인간 감독에 의존하고 있으며, 이는 미래의 AI 시스템에서는 한계가 있을 수 있다. 이 연구는 약한 감독자가 실질적으로 더 강한 모델을 신뢰하고 제어할 수 있는 방법을 제시했다는 평가다.
또한 오픈AI는 이 연구를 지원하기 위해 대학원생, 학자, 기타 연구자들을 위한 1,000만 달러 규모의 보조금 프로그램을 시작한다고 발표했다. 이것은 초지능 AI 시스템을 안전하게 조정하는 방법을 찾는 것이 점점 더 중요해지고 있음을 보여준다. 연구팀은 이러한 접근 방식이 미래의 AI 정렬 문제에 대한 새로운 해결책을 제시할 것으로 기대하고 있다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 불법 텐트로 몸살 앓는 청계산…“추워서 어쩔 수 없어” - 매일경제
- “과한 의전 요구에 네덜란드, 한국대사 초치”…외교부 “협의 과정일뿐” - 매일경제
- 이재용, 양 손 볼에 올리고 미소…귀국길 공항서 표정 밝은 이유가 - 매일경제
- “40만원 아낄 수 있었는데”…대출 갚을때 은행이 가르쳐주지 않는 ‘이것’ - 매일경제
- 서울 지하철 5호선 연장 노선 내주 발표 전망 - 매일경제
- 성공하면 타고싶은 현대車…제네시스 “우리 안전은 우연이 아니야, 그것은~” [왜몰랐을카] -
- 냉온탕 오가는 엔화값 …"지금이 엔테크 적기" - 매일경제
- 박지성도 ‘빵 터진’ 총선 영입설 왜?… “한국에 살지도 않는데” - 매일경제
- 안경 고쳐 썼을 뿐인데 “저기요” 갑질…진상팬 논란에 병드는 공연장 - 매일경제
- 펩 놀라게 한 또 다른 ‘코리안 가이’ 황인범, 1골 1도움 맹활약 그 후 “우리가 자랑스럽다” [