[기고] 고객 마음까지 읽어야 `진짜` AI

2024. 9. 18. 18:42
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

생물학에서 동종교배는 유전적으로 유사한 개체들끼리 교배할 때 발생하는 문제를 말한다.

'데이터 동종교배'란 AI가 동일하거나 매우 유사한 유형의 데이터로만 학습할 때 발생하는 현상으로, 이로 인해 모델이 편향되고 다양성이 부족해질 위험이 있다.

최근 AI 모델의 성능 저하 사례는 데이터 동종교배의 문제를 적나라하게 보여준다.

데이터 동종교배의 문제를 해결하고 AI가 인간을 더 깊이 이해하도록 하기 위해서는 다양한 데이터의 사용이 필수적이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

안진호 한국디자인산업연합회 부회장·㈜아이디이노랩 대표

생물학에서 동종교배는 유전적으로 유사한 개체들끼리 교배할 때 발생하는 문제를 말한다. 이러한 현상의 위험성은 역사적으로 스페인 합스부르크 왕가의 사례에서 잘 드러난다.

16~17세기 왕위 계승권 유지를 위해 근친혼을 반복한 결과, 마지막 왕 찰스 2세에서 심각한 문제가 나타났다. 찰스 2세는 심한 턱 돌출, 언어 장애, 지적 장애, 불임 등 다양한 건강 문제를 겪었다. 결국 그는 후사 없이 사망하며 왕조가 끝났다. 이는 근친교배로 인한 유전적 다양성 감소와 그 위험성을 명확히 보여준다.

인공지능(AI)의 데이터 학습에서도 유사한 문제가 발생할 수 있다. '데이터 동종교배'란 AI가 동일하거나 매우 유사한 유형의 데이터로만 학습할 때 발생하는 현상으로, 이로 인해 모델이 편향되고 다양성이 부족해질 위험이 있다.

최근 AI 모델의 성능 저하 사례는 데이터 동종교배의 문제를 적나라하게 보여준다. 2023년 스탠포드 대학의 연구에 따르면, 챗GPT 모델이 다양한 작업에서 성능 저하를 겪었고, 특히 수학 문제에서 두드러졌다. 오픈AI사는 이전 버전에 비해 더 나은 성능을 기대했지만, 일부에서는 성능이 오히려 감소한 것으로 나타났다. 이는 AI가 인간의 복잡한 사고 과정과 문제 해결 능력을 제대로 모방하지 못하고 있음을 시사한다.

데이터 동종교배의 문제를 해결하고 AI가 인간을 더 깊이 이해하도록 하기 위해서는 다양한 데이터의 사용이 필수적이다. 그중에서도 에스노그라피 데이터는 매우 중요한 역할을 할 수 있다. 에스노그라피는 사람들의 일상 생활을 관찰하고 그들의 경험과 감정을 심층적으로 연구하는 방법이다. 이를 통해 수집된 데이터는 AI에게 단순한 패턴이나 통계 이상의 질적인 학습 기회를 제공하며, 인간의 복잡한 행동과 동기를 이해하는 데 도움을 준다.

예를 들어, 전자제품 회사가 소비자 구매 패턴을 분석할 때 단순한 판매 데이터로는 표면적인 행동만 이해할 수 있다. 그러나 에스노그라피 데이터를 활용하면 소비자의 감정적·사회적 맥락까지 파악할 수 있어 AI 모델에 반영 시 더 정확하고 인간적인 예측이 가능하다. AI 모델의 성능을 더욱 향상시키고 인간에 대한 이해를 깊게 하기 위해서는 파인 튜닝(fine-tuning)이 필수적이다.

제대로 된 파인 튜닝은 에스노그라피 데이터로 AI 모델을 조정하는 것이다. 패션 브랜드에서 AI로 고객 취향을 분석할 때 구매 기록뿐만 아니라 고객의 실제 착용 경험 데이터를 학습시키면 AI는 고객의 선호도와 감정까지 분석할 수 있다.

반면, 잘못된 파인 튜닝은 AI가 자체 생성한 데이터를 반복 학습하는 경우를 이른다. 이는 AI의 데이터 다양성을 제한하고 편향된 예측을 초래해 새롭고 복잡한 문제 해결 능력을 저하시킨다는 문제를 낳는다.

AI 모델의 성능을 유지하고 개선하며 인간에 대한 깊은 이해를 달성하기 위해서는 다양한 출처에서 수집한 질 높은 데이터가 필수적이다. 그중에서도 에스노그라피 데이터는 AI가 인간의 복잡한 사회적·감정적 맥락을 이해하도록 돕는 중요한 역할을 한다. 이러한 데이터를 AI 모델에 통합하면, AI는 단순한 정보 처리 도구가 아닌, 인간다운 상호작용과 개인화된 서비스를 제공하는 도구로 진화할 수 있다. 다만, 이러한 접근법의 실제 효과성과 구현 방법에 대해서는 추가적인 연구와 검증이 필요하다.

AI 모델의 성능 향상과 데이터 다양성 확보, 그리고 이를 통한 인간에 대한 깊은 이해는 지속적인 연구와 혁신이 필요한 분야이다. 앞으로도 다양한 시도가 이어져야 할 것이다. 이를 통해 우리는 진정으로 인간을 이해하고 상호작용할 수 있는 AI를 개발할 수 있을 것이다.

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?