20대 자주 쓰는 말 1위 욕, 50대는 '이것'

조회수 2022. 11. 15. 17:40
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

여성과 남성의 언어는 어떻게 다를까?

심리학자들이 페이스북에 올라온 글 수십만 개에 사용된 단어를 분석했다. 그러고 남성과 여성이 사용하는 단어의 빈도를 측정했다. 이후 그들은 영어권에서 남성들이 가장 많이 쓰는 단어와 여성들이 가장 많이 쓰는 단어가 무엇인지 발표했다. 선호되는 단어를 보면 대부분 고개가 끄덕여진다.

예를 들어, 여성은 남성에 비해 ‘쇼핑’‘머리 스타일’에 관한 이야기를 훨씬 자주 한다. 남성은 여성보다 ‘축구’‘엑스박스’에 관한 이야기를 훨씬 자주 한다. 굳이 심리학자가 빅데이터를 분석하지 않아도 알 수 있는 일이다.

하지만 좀 더 흥미로운 결과도 있다.

여성남성에 비해 내일’이라는 단어를 훨씬 많이 사용한다. 아마도 남성들이 앞으로의 일을 생각하는 데 재주가 없기 때문일 것이다.

다음 페이지에 대부분의 남성이 사용하는 단어와 대부분의 여성이 사용하는 단어를 보여주는 워드 클라우드word cloud가 있다. 단어가 크게 보일수록 그 단어의 사용이 해당 성별에 더 많이 치우쳐 있다는 뜻이다.

이 연구에서 마음에 드는 점은 오랫동안 존재해왔지만 우리가 인식하지 못했던 패턴을 새로운 데이터가 알려준다는 것이다. 남성과 여성은 항상 다른 방식으로 말해왔다.

하지만 수만 년 동안 이 데이터는 음파가 공중으로 흩어지자마자 없어졌다. 이제 이 데이터를 컴퓨터에 보존하고 컴퓨터로 분석할 수 있다.

남성의 언어
여성의 언어

내 성별에 맞춰 다시 말해보자면,
“단어들은 존나 먼지 하나 없이 사라졌었다. 이제 풋볼도, 엑스박스도 그만 두고 이 망할 것들을 연구해야지. 어떤 놈이 신경 쓸지는 몰라도.”


남성과 여성만이 아니다. 사람들은 연령에 따라 다른 단어를 사용한다. 여기서 노화가 어떻게 진행되는지 단서를 얻을 수 있다. 동일한 연구를 통해 페이스북에서 연령에 따라 사람들이 불균형하게 사용하는 단어들도 알 수 있다.

나는 이 그림을 ‘마시고 일하고 기도하고’라고 부른다.

사람들은 10대 때 술을 마신다. 20대 때는 일을 한다. 30대 이후에는 기도를 한다.

19~22세
23~29세
30~65세

글을 분석하는 강력하고 새로운 도구로 ‘감성 분석sentiment analysis’이라는 것이 있다. 과학자들은 이제 어떤 글의 특정한 단락이 얼마나 행복한지, 슬픈지를 측정할 수 있다.

이를 위해 여러 팀의 과학자들이 많은 사람들에게 영어 단어 수만개를 긍정적인 것과 부정적인 것으로 코드화해달라고 요청했다. 이 방법론에 따르면 가장 긍정적인 단어군에는 ‘happy(행복한)’, ‘love(사랑)’, ‘awesome(기막히게 좋은)’ 등이 있었다. 가장 부정적인 단어군에는 ‘sad(슬픈)’, ‘death(죽음)’, ‘depression(우울)’이 포함됐다.

과학자들은 거대한 단어 세트로 이뤄진 감성 지표를 만들었다. 그들은 이 지표를 이용해 글의 특정 단락에 있는 단어의 평균적인 기분을 측정한다.

누군가가 ‘나는 행복하고, 사랑에 빠져 있으며, 기막히게 기분이 좋다’라고 적는다면 감성 분석은 그 글을 극히 행복한 글로 코드화할 것이다. 누군가가 ‘세상의 모든 죽음과 우울한 일을 생각하니 슬프다’라고 적는다면 감성 분석은 그 글을 극히 슬픈 글로 코드화할 것이다. 다른 글들은 그 양극단 사이 어딘가에 자리할 것이다.

글의 기분을 코드화함으로써 무엇을 배울 수 있을까?

페이스북 데이터 과학자들은 아주 흥미로운 가능성 하나를 제시했다. 매일 한 나라의 국민총행복을 측정하는 것이다. 사람들의 상태 메시지가 긍정적이라면 그 나라는 그날 행복한 것으로 추정한다.


사람들이 말하는 것이 아니라 그들이 '하는' 것을 믿어라

이 콘텐츠에 대해 어떻게 생각하시나요?