“답변 부탁합니다”…공손한 말투, AI에 효과 있을까?

정확한 답 얻으려면 ‘정중해야 vs 무례해야’
영 BBC, “인공지능 연구마다 결과 엇갈려”
전문가들 “관건은 명확하고 구체적인 질문”

인공지능에서 더 정확한 답변을 얻으려면 공손한 말투가 효과적이라는 통념에 대해, 전문가들은 대체로 “과학적으로 입증되지 않았다”고 지적한다. 클립아트코리아

생성형 인공지능(AI)을 쓸 때 더 정확한 답을 얻으려고 나름의 ‘요령’을 찾는 사람들이 많다. 누군가는 강하게 말해야 잘 답한다고 하고, 또 누군가는 “부탁합니다”처럼 공손하게 표현해야 답변의 질이 높아진다고 믿는다.

하지만 이런 통념이 과학적으로 뚜렷하게 입증된 것이 아니라는 지적이 나왔다. 실제로 효과가 있는지를 둘러싼 연구 결과도 엇갈린다는 이유에서다.

“AI에 정중해야 더 정확?”…연구에서는 결과 엇갈려

영국 BBC에 따르면, 2024년 쯔치 인 교수 등이 참여한 미국 코넬대학교 연구진은 정중한 표현으로 질문할 때 더 정확하고 완성도 높은 답변이 나오는 경향을 확인했다.

연구팀은 공손한 정도를 8단계로 나눠 실험한 결과, ‘중간 수준의 공손함(Moderate Politeness)’에서 가장 안정적인 성능이 나타났다고 밝혔다. 특히 극도로 무례한 표현을 사용하면 모델이 답변을 거부하거나, 요청한 형식을 따르지 않는 사례가 늘어난 것이 확인됐다.

연구진은 이같은 결과에 대해 대규모 언어모델(LLM)이 인간의 언어 예절과 문화적 맥락을 반영해 학습됐기 때문이라고 설명했다. 사회적 규범에 맞는 적절한 수준의 공손함이 보다 정확한 문답을 이끌어냈다는 분석이다.

그러나 상반된 연구 결과도 있다. 2025년 옴 도바리야 등 코넬대학교 연구진이 진행한 분석에서는 챗GPT에 모욕적이거나 강한 표현을 사용하면 정답률이 오히려 높아지는 경향이 관찰됐다.

실제 연구진이 챗GPT-4o를 대상으로 수학·과학·역사 문제를 시험한 결과, ‘매우 무례한(Very Rude)’ 프롬프트의 평균 정확도는 84.8%로 나타났다. 반면 ‘매우 공손한(Very Polite)’ 프롬프트는 80.8%로 가장 낮은 정확도를 기록했다.

이처럼 연구마다 결과가 엇갈리면서 ‘예의를 지키면 AI가 더 잘 답한다’라거나 ‘무례하게 말해야 성능이 오른다’는 주장 모두 단정하기 어렵다는 게 전문가들의 공통된 시각이다.

그럼, 어떻게 질문하면 될까?

생성형 AI에서 원하는 응답을 이끌어내기 위해, 전문가들은 질문을 명확하고 구체적으로 설계하는 것이 중요하다고 조언했다.

미국 밴더빌트대학교에서 생성형 AI를 연구하는 줄스 화이트 교수는 BBC와의 인터뷰에서 “LLM은 감정을 느끼는 존재가 아니라, 확률적으로 다음 단어를 예측하는 시스템”이라며 “원하는 결과의 형태를 명확하게 제시하는 것이 가장 효과적인 방법”이라고 말했다.

예컨대 “좋은 답변을 해달라”고 막연히 요청하기보다 “장단점을 각각 3가지씩 정리해달라”거나 “사례를 2개 포함해 설명해달라”고 구체적으로 지시하는 편이 답변의 완성도를 높일 수 있다는 것이다.

이어 줄스 화이트 교수는 “LLM에 문제를 풀게 하는 마법 같은 단어 조합은 없다”며 “중요한 건 얼마나 분명하게 설명했는지에 달렸다”고 강조했다.

[용어설명] 대규모 언어모델(LLM)

대규모 언어모델(LLM·Large Language Model)은 대규모의 언어 데이터를 학습해 자연어 이해와 생성 작업에 탁월한 성능을 보이는 심층 신경망 모델을 말한다 . 주어진 언어 범위 내에서 정해진 패턴이나 관계를 학습하는 기존 언어 모델과 달리, 대규모 언어 데이터 학습을 바탕으로 문법과 의미 등을 파악해 인간과 자연스러운 대화 형태로 상호작용할 수 있다. 대표적인 예로 오픈AI사의 GPT, 구글의 버트(BERT), 메타의 라마(LLaMA) 등이 있다.