어떤 노래가 어떤 감성을 표현하고 있을까? 다섯 곡의 팝 명곡을 가사 감성 분석을 통해 살펴보았습니다.
감성 분석 (Sentiment Analysis)은 텍스트에 나타난 의견, 평가, 태도와 같은 주관적인 정보를 분석하는 것을 의미합니다. 문자 그대로 발화자의 감성을 분석하는 것이죠.
감성의 정도를 극성 (Polarity)이라고 하며, 분석 과정에서 극성은 보통 숫자로 표현됩니다. 숫자가 0이면 중립 (neutral), 양이면 긍정 (positive), 음이면 부정 (negative)을 나타냅니다. 절댓값이 1에 가까울수록 감성의 정도가 강하다고 할 수 있습니다.
노래 가사는 Genius API for the lyrics를 통해 수집하였으며, 감성 분석의 진행은 NLTK (Natural Language Tool Kit)을 통해 분석하고 맷플롯리브 (Matplotlib) 패키지를 통해 시각화했습니다.
[1] Nirvana – Lithium
전반적으로 긍정적인 내용을 담고 있는 것으로 분석되었습니다. yeah, yeah 가 많이 반복되는 노래인데, 이를 긍정이 아니라 중립으로 처리했다면 긍정-중립-부정 비율이 비교적 균등한 노래로 분석되지 않았을까 합니다.
[2] The Cardigans – Lovefool
전반적으로 긍정-중립-부정 비율이 균등한 노래로 분석되었습니다. love me, leave me, fool me가 반복되는 노래인데, 사랑의 과정이 어떤 때는 긍정적으로, 어떤 때는 중립적으로, 어떤 때는 부정적으로 표현되는 것이 재미있습니다.
[3] John Lennon – Love
다섯 곡 중에서 가장 긍정적인 내용을 담고 있는 곡으로 분석되었습니다. love 및 love와 매칭된 단어들이 모두 높은 수준의 긍정 단어이기 때문이며, 짧은 문장과 직접적인 표현으로 감성 분석의 가장 대표적인 긍정 사례로 들기에 적합합니다.
[4] Brainbombs – No Guilt
다섯 곡 중에서 가장 부정적인 내용을 담고 있는 곳으로 분석되었습니다. 해석하기조차 조심스러운 수준의 부정 단어와 문장들이 많습니다. 알고리즘 보정을 통해, I still eat your flesh를 중립으로 처리하는 것에서 부정으로 처리하는 것으로 수정해야 할 듯합니다.
[5] Grace Jones – Bullshit
다섯 곡 중에서 가장 감성 변화의 폭이 큰 것으로 분석되었습니다. 중립적인 가사는 딱 한 번만 표현되었습니다. 같은 콘텐츠 내에서도 감성 변화의 폭이 얼마나 클 수 있는지를 보여주는 대표적인 사례라고 할 수 있습니다.
최근의 감성 분석은 웹상의 콘텐츠를 크롤링으로 수집하여 잘 조직된 인공지능 기반 알고리즘을 통해 단어나 문장 단위로 부정, 중립, 긍정을 분석합니다. 대량의 콘텐츠를 신속 정확하게 처리할 수 있다는 점, 인간의 가장 주관적인 영역인 감성을 수치적으로 객관화할 수 있다는 점을 장점으로 꼽을 수 있으며, 비즈니스에서는 소비자를, 정치와 정책에서는 유권자를 이해하는 목적으로 널리 활용되고 있습니다.
크롤링과 감성 분석은 유펜솔루션과 상의해 주세요!
(본 포스팅은 https://www.reddit.com/r/dataisbeautiful/comments/y6u96f/oc_sentiment_analysis_of_song_lyrics/ 의 내용을 번역, 재구성하였습니다)
Comentarios