“답변 부탁합니다”…공손한 말투, AI에 효과 있을까?
영 BBC, “인공지능 연구마다 결과 엇갈려”
전문가들 “관건은 명확하고 구체적인 질문”

생성형 인공지능(AI)을 쓸 때 더 정확한 답을 얻으려고 나름의 ‘요령’을 찾는 사람들이 많다. 누군가는 강하게 말해야 잘 답한다고 하고, 또 누군가는 “부탁합니다”처럼 공손하게 표현해야 답변의 질이 높아진다고 믿는다.
하지만 이런 통념이 과학적으로 뚜렷하게 입증된 것이 아니라는 지적이 나왔다. 실제로 효과가 있는지를 둘러싼 연구 결과도 엇갈린다는 이유에서다.
연구팀은 공손한 정도를 8단계로 나눠 실험한 결과, ‘중간 수준의 공손함(Moderate Politeness)’에서 가장 안정적인 성능이 나타났다고 밝혔다. 특히 극도로 무례한 표현을 사용하면 모델이 답변을 거부하거나, 요청한 형식을 따르지 않는 사례가 늘어난 것이 확인됐다.
연구진은 이같은 결과에 대해 대규모 언어모델(LLM)이 인간의 언어 예절과 문화적 맥락을 반영해 학습됐기 때문이라고 설명했다. 사회적 규범에 맞는 적절한 수준의 공손함이 보다 정확한 문답을 이끌어냈다는 분석이다.
그러나 상반된 연구 결과도 있다. 2025년 옴 도바리야 등 코넬대학교 연구진이 진행한 분석에서는 챗GPT에 모욕적이거나 강한 표현을 사용하면 정답률이 오히려 높아지는 경향이 관찰됐다.
실제 연구진이 챗GPT-4o를 대상으로 수학·과학·역사 문제를 시험한 결과, ‘매우 무례한(Very Rude)’ 프롬프트의 평균 정확도는 84.8%로 나타났다. 반면 ‘매우 공손한(Very Polite)’ 프롬프트는 80.8%로 가장 낮은 정확도를 기록했다.
이처럼 연구마다 결과가 엇갈리면서 ‘예의를 지키면 AI가 더 잘 답한다’라거나 ‘무례하게 말해야 성능이 오른다’는 주장 모두 단정하기 어렵다는 게 전문가들의 공통된 시각이다.
미국 밴더빌트대학교에서 생성형 AI를 연구하는 줄스 화이트 교수는 BBC와의 인터뷰에서 “LLM은 감정을 느끼는 존재가 아니라, 확률적으로 다음 단어를 예측하는 시스템”이라며 “원하는 결과의 형태를 명확하게 제시하는 것이 가장 효과적인 방법”이라고 말했다.
예컨대 “좋은 답변을 해달라”고 막연히 요청하기보다 “장단점을 각각 3가지씩 정리해달라”거나 “사례를 2개 포함해 설명해달라”고 구체적으로 지시하는 편이 답변의 완성도를 높일 수 있다는 것이다.
이어 줄스 화이트 교수는 “LLM에 문제를 풀게 하는 마법 같은 단어 조합은 없다”며 “중요한 건 얼마나 분명하게 설명했는지에 달렸다”고 강조했다.
Copyright © 농민신문. 무단전재 및 재배포 금지.