반크, 국내 최초 ‘생성형 AI 한국 특화 이미지 성능평가지표’ 구축

ChatGPT 1위, Grok 최하위…영토 표기·전통 의복·문화유산 전반에서 오류 두드러져 사이버 외교사절단 반크(단장 박기태)가 생성형 AI 플랫폼의 한국 문화 이미지 재현 정확성을 비교·평가하는 AI 성능평가지표를 국내 최초로 구축했다. 글로벌 한국 문화 열풍 속에서 생성형 AI가 이를 얼마나 정확하게 구현하는지를 체계적으로 분석한 첫 사례다.
3월 21일, BTS가 앨범명 ‘아리랑’을 내세워 광화문에서 컴백 공연을 진행했다. 공연은 막을 내렸지만 전 세계 팬덤(ARMY)의 방한으로 아리랑·광화문·한복 등 한국 전통문화와 역사에 대한 국제적 관심은 더욱 확대될 것으로 보인다.
넷플릭스 애니메이션 ‘케이팝 데몬 헌터스(케데헌)’는 제98회 아카데미 시상식에서 장편 애니메이션상과 주제가상을 동시 석권했다. 작품 속 ‘갓’을 착용한 등장인물과 시상식 축하 무대에서 선보인 ‘판소리’ 공연은 한국 전통문화에 대한 전 세계적 관심을 한층 끌어올리는 계기가 됐다.
이러한 관심은 자연스럽게 생성형 AI를 통한 정보 탐색으로 이어지고 있다. 이용자들은 단순 검색을 넘어 이미지를 직접 생성·재가공하며 정보를 소비한다. 반크는 이 과정에서 한국 문화 관련 오류가 광범위하게 확산하고 있다는 점에 주목했다.
반크 조사 결과, 생성형 AI가 만들어낸 한국 문화 이미지에서는 국적 혼동, 전통 요소 왜곡, 핵심 요소 누락 등 다양한 오류가 확인됐다.
이번 BTS 컴백 앨범명이기도 한 ‘아리랑’을 부르는 인물 이미지에서는 한국적 맥락이 전혀 반영되지 않거나(Grok), 일본 문화의 상징인 벚꽃이 뒤섞이는(Gemini) 등 국적 혼동이 발생했다. ‘판소리’ 이미지에서도 공연의 핵심 요소인 고수(鼓手)의 북장단이 누락되거나(Copilot), 중국 경극 요소가 결합하는(Grok) 사례가 나타났다.
전통 의복에서도 왜곡이 두드러졌다. 남성 한복에는 치파오식 단추 장식이나 현대식 로퍼, 벚꽃 배경이 혼재됐고(Perplexity), 여성 한복에서는 레이스 장식(Perplexity)이나 이마까지 내려오는 머리 장식(Grok), 불균형한 치마 길이(Bing) 등이 나타났다. ‘갓’의 경우 실재하지 않는 장식이 추가되거나(Grok), 전혀 무관한 ‘과일’ 이미지가 생성되는(Bing) 등 표현 정확도가 현저히 낮았다.
세부 묘사가 요구되는 유형문화유산 이미지에서는 구조적 오류가 더욱 뚜렷했다.
BTS 공연을 계기로 전 세계 팬들의 경복궁 방문이 크게 늘어날 것으로 예상되지만 ‘경복궁’ 이미지에서는 품계석과 12지신 동상이 누락되고, 근정전 주변 건물이 중국식 황궁을 연상시키는 색채로 표현되는 사례(Perplexity)가 확인됐다.
특히 2020년 미국 NBC ‘지미 팰런쇼’의 배경으로 소개된 근정전과 경회루를 연계한 투어가 팬들 사이에서 주목받고 있는 가운데, ‘근정전’ 이미지 요청 시 건축물의 기본 형식을 구현하지 못하고 전혀 무관한 기계 이미지를 생성하는 사례(Bing)도 나타났다. 이는 한국 궁궐 건축의 핵심 공간이 AI에 의해 전혀 다른 대상으로 치환된 사례다.
‘경회루’ 역시 연꽃 요소가 추가되며 향원정과 혼동된 이미지가 생성됐고(Perplexity), 기둥 수와 칸 수, 누각 구조 등 전반적인 건축 요소가 실제와 다르게 구현된 사례(Grok, Gemini)가 확인됐다.
반크는 이처럼 BTS 팬들이 실제 방문하게 될 공간에 대해 AI가 왜곡된 이미지를 제공할 경우, 방문 전 인식 형성 단계부터 실제 경험에 이르기까지 왜곡이 이어질 수 있다고 지적했다. 특히 글로벌 이용자들이 생성형 AI를 통해 경복궁을 사전 탐색하고 방문 계획을 수립하는 흐름 속에서 부정확한 이미지가 문화 이해를 저해하는 요인으로 작용할 수 있다는 우려다.
반크는 기존의 교과서·지도·사전 오류 시정 활동을 생성형 AI 영역으로 확장해 분석을 진행해 왔다. 서울·경기도·경주·충청북도 등 각 지자체와 연계한 AI 결과물 분석 및 정책 제안 과정에서 플랫폼별 오류 유형과 반복 패턴을 확인했고, 이를 바탕으로 플랫폼 간 성능을 객관적으로 비교할 수 있는 평가지표 구축에 착수했다.
평가는 ChatGPT, Perplexity, Grok, Bing, Gemini, Copilot 등 6개 플랫폼을 대상으로 진행됐다. 분석은 영토(독도, 동해), 음식·식문화(김치·김장, 비빔밥), 전통 의복(한복, 갓), 무형유산(한글, 태권도, 아리랑, 판소리, 강강술래), 유형문화유산(경복궁, 석굴암, 불국사, 수원화성)의 5개 분야, 총 15개 세부 항목으로 구성됐다.
각 항목은 ▲구성 요소 정확성 ▲문화 고유성·비혼동성 ▲역사·시대 맥락 적합성의 3개 기준으로 4점 만점 채점되어, 항목별 평균 점수의 합산으로 플랫폼별 최종 순위를 도출했다.
최종 순위는 ChatGPT(50.33), Copilot(45.17), Gemini(39.50), Perplexity(38.17), Bing(34.06), Grok(30.44) 순으로 나타났다. 특히 독도·동해 영토 표기와 한글, 갓, 유형문화유산 영역 전반에서 오류가 두드러졌다.
분석 결과, 생성형 AI는 시각적 특징이 뚜렷하고 학습 데이터가 풍부한 영역에서는 비교적 높은 정확도를 보였지만, 구조적 이해와 역사적 맥락이 요구되는 분야에서는 공통적인 한계를 드러냈다. 특히 음식·식문화 분야는 안정적인 성과를 보였으나, 영토와 문화유산 영역에서는 전반적인 점수 하락과 함께 플랫폼 간 편차가 두드러지게 나타났다.
영토 항목은 전체 평가 영역 가운데 가장 낮은 점수를 기록했다. 반크는 그간 독도와 동해 표기 바로잡기를 지속해서 추진하며 실질적인 성과를 축적해 왔지만, 생성형 AI에서는 여전히 지리적 명칭과 공간 개념을 재현하는 과정에서 한국의 입장이 충분히 반영되지 못하고 있는 것으로 나타났다.
유형문화유산 분야 역시 한계가 뚜렷했다. 건축 구조와 공간 배치, 역사적 맥락을 종합적으로 반영해야 하는 특성상 높은 수준의 정교성이 요구되지만, 대부분 플랫폼이 이러한 복합적 요소를 구현하는 데 어려움을 보였다. 모든 세부 요소를 완벽히 재현하는 데에는 기술적 제약이 따르더라도, 최소한 기본적인 구조와 배치, 핵심 건축 요소를 충실히 반영해 한국 고유의 역사적 맥락을 훼손하지 않는 수준까지는 구현이 필요하다는 것이 반크의 입장이다.
반크는 이러한 이미지 오류가 검증 없이 확산할 때 이용자 인식에도 오류가 고착되고 한국 문화 왜곡으로 이어질 수 있다고 지적했다. BTS 공연과 케데헌을 계기로 한국에 대한 높아진 관심이 AI 검색으로 이어지는 지금, 결과물의 정확성이 그 어느 때보다 중요해지는 이유다.
이번 성능평가지표 분석을 담당한 반크 이세연 청년연구원은 “이번 평가를 통해 플랫폼 전반에서 반복되는 오류 유형과 취약 지점을 구조적으로 확인할 수 있었다”며, “특히 동아시아 문화 요소가 혼재되는 현상은 문화 고유성에 대한 인식을 흐릴 수 있다는 점에서 개선이 시급하다”고 말했다. 이어 “생성형 AI를 통해 한국을 접하는 글로벌 이용자가 늘고 있는 만큼, 한국의 고유성과 문화적 맥락이 정확하게 구현될 수 있도록 지속적인 점검이 필요하다“고 강조했다.
반크 박기태 단장은 “개별 사례 중심의 AI 오류 분석을 넘어, 이를 통합적으로 비교·평가할 수 있는 국가 단위 성능평가지표를 국내 최초로 구축했다는 데 의미가 크다”며, ”이 지표는 AI 학습 데이터 내 정보 공백과 편향을 정량적으로 확인한 결과물로, 향후 한국 문화 확산 전략의 기준점이 될 것“이라고 밝혔다. 또한 ”BTS와 케데헌을 통해 한국에 대한 세계인의 관심이 전례 없이 높아진 지금, 생성형 AI 속 오류를 선제적으로 바로잡는 것이 정확한 국가 이미지를 전달하는 핵심 과제“라고 덧붙였다.
반크는 이번 이미지 평가에 이어 텍스트 기반 결과물을 분석하는 ‘AI 서술 성능평가지표’ 구축에도 착수할 계획이다. 방대한 텍스트로 정보가 제공되는 서술형 AI 결과물에서는 보다 다층적인 오류 분석이 가능할 것으로 기대된다. 아울러 현행 지표를 정기적으로 재검토해 플랫폼별 개선 여부를 지속 모니터링하고, 생성형 AI 환경에서 한국 관련 정보의 정확성을 높이기 위한 활동을 이어갈 방침이다.
반크가 작성한 AI 성능평가지표 이미지 분석 보고서는 아래 링크를 통해 확인할 수 있다.
이수진 기자 sujinl22@donga.com
Copyright © 스포츠동아. 무단전재 및 재배포 금지.
- “이게 무슨 일”…심권호, 완전히 바뀐 얼굴 ‘충격’ (조선의 사랑꾼)
- 정선희 말 바꾸나 “62세부터 문란하게 살 것” 해명 (말자쇼)
- 최홍만, 먹방 중 옛 연인에 영상편지…허경환 “거짓말 아니냐” 저격 (거인인데요)
- ‘국민가수’ 이선희, 15일 컴백…박근태와 재회 [공식]
- 이미주♥최다니엘, 둘이 뭐야?…“플러팅 확 들어오네” (석삼플레이)
- 박은빈, 레드 드레스 입고…확 바뀐 분위기 [DA★]
- “이게 무슨 일”…심권호, 완전히 바뀐 얼굴 ‘충격’ (조선의 사랑꾼)
- “모텔 여사장과 잤다” 불륜남 후보만 5명? 문어발 외도 (탐비)
- 김연아, 스케이트 벗고 발레복 입었다…‘죽음의 무도’ 6일 전격 공개
- ‘국민가수’ 이선희, 15일 컴백…박근태와 재회 [공식]