"너는 OO 전문가야"...AI 페르소나 프롬프팅, 효과 있을까?
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI)에게 특정 분야의 전문가라는 역할을 부여하는 '페르소나 프롬프팅'이 실제로는 코딩이나 수학처럼 정밀한 지식이 필요한 작업에서 오히려 AI의 정확도를 떨어뜨린다는 연구 결과가 나왔다.
최근 AI 사용자들 사이에서는 지시어(프롬프트)를 입력할 때 "당신은 이 분야의 숙련된 전문가입니다"라는 문구를 추가하면 성능이 향상된다는 설이 상식처럼 통용돼 왔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=백봉삼 기자)인공지능(AI)에게 특정 분야의 전문가라는 역할을 부여하는 '페르소나 프롬프팅'이 실제로는 코딩이나 수학처럼 정밀한 지식이 필요한 작업에서 오히려 AI의 정확도를 떨어뜨린다는 연구 결과가 나왔다.
최근 AI 사용자들 사이에서는 지시어(프롬프트)를 입력할 때 "당신은 이 분야의 숙련된 전문가입니다"라는 문구를 추가하면 성능이 향상된다는 설이 상식처럼 통용돼 왔다.
하지만 남가주 대학교(USC) 지자오 후 연구팀이 최근 프리프린트 서버 'arXiv'에 게재한 논문에 따르면, 이런 방식은 분야에 따라 득보다 실이 많을 수 있는 것으로 나타났다.

'전문가인 척' 하느라 전문 지식 놓치는 AI
레지스터닷컴·기가진 등 외신에 따르면, 연구팀은 'Llama-3.1-8B'와 'Qwen 2.5-7B' 등 6종의 AI 모델을 대상으로 실험을 진행했다. AI에게 단순히 "당신은 소프트웨어 엔지니어입니다"라고 짧게 지시하거나, 혹은 전문 지식과 경험이 풍부하다는 식의 복잡한 페르소나를 부여한 뒤 성능을 측정했다.
실험 결과, 여러 차례의 대화를 통해 품질을 평가하는 'MT-Bench' 테스트에서는 글쓰기나 추론 분야의 출력 품질이 향상되는 긍정적인 효과가 나타났다. 특히 AI가 인간의 윤리관에 어긋나는 답변을 하지 않도록 하는 'AI 얼라인먼트(정렬)' 측면과 보안 취약점을 이용한 공격(Jailbreak) 방어력은 크게 개선됐다.
반면, 실제 정답률이 중요한 코딩·수학·인문과학 분야에서는 오히려 품질이 하락했다. 광범위한 지식 측정 지표인 'MMLU' 벤치마크에서도 "당신은 전문가입니다"라고 지시했을 때 전체적인 정확도가 눈에 띄게 떨어졌다.
"역할 수행에 능력 낭비... 구체적 요구사항 전달이 효과적"

연구팀은 이러한 현상의 원인을 AI의 자원 배분 문제로 분석했다. AI에게 전문가 역할을 부여한다고 해서 없던 전문 지식이 실제로 생겨나는 것은 아니다. 오히려 AI가 '전문가처럼 보이게 답변하는 것(지시 추종)'에 능력을 집중하느라, 정작 사실을 기억해내고 계산하는 데 써야 할 능력을 소진하게 된다는 설명이다.
연구를 주도한 후 씨는 "AI에게 '당신은 숙련된 프로그래머'라고 말하는 것은 코드의 품질을 높이는 데 도움이 되지 않는다"며 "오히려 프로젝트 요건과 요구사항을 상세하게 전달하는 것이 사용자가 원하는 결과물을 얻는 데 훨씬 효과적"이라고 조언했다.
백봉삼 기자(paikshow@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- '사람 중심' HR테크 컨퍼런스 5월 열린다
- "AI가 흉내 못 내는 단 하나, 인간의 ‘딴짓’에 미래 있다"
- AI 시대, HR이 꼭 챙겨야할 '변하지 않는 가치' 뭘까
- "기술은 날개일 뿐, 비행기 띄우는 건 사람의 신뢰와 팀워크"
- 상사 눈치 보지 않고 직장서 힐링...엔피 마인드케어 '무아홈' 해보니
- "수십억원 손실도"…삼성전자 노조 파업, 소부장 업계 '비상등'
- 쿠팡 개인정보 유출 조사 마무리…개인정보위 "곧 결정"
- 정부 GPU 프로젝트, 네이버·삼성·엘리스 3파전 윤곽…목표 물량 확보는 '난제'
- "정용진 회장 혁신 통했다"...이마트, 1Q 영업익 14년 만에 최대
- 트레이더스 키운 이마트·허리띠 졸라맨 롯데마트...투톱 체제 강화