웹 크롤링하는 한과장
'모바일 앱 사용자들의 별점은 얼마나 정확할까?'
웹 크롤링을 활용한 시장조사
모바일 앱을 다운받으며 리뷰를 보던 한과장
문득, 의문이 들었다.
사용자들이 남긴 별점은 얼마나 정확할까?
정말 사용자들의 만족도를 반영하고 있을까?
“앱 사용자들의 만족도는 별점에 잘 반영되고 있는걸까?”
궁금증이 생긴 한과장은
구글플레이스토어에서 인기 앱 리뷰 별점과 내용을 확인해보기로 한다.
구글플레이스토어의 '인기 앱'은 무료와 유료로 나뉜다.
[구글 플레이스토어 무료 인기앱]
[구글 플레이스토어 유료 인기앱]
"웹 크롤링을 통해 무료앱 200개, 유료앱 195개의
별점과 리뷰를 모아보자"
스파이더킴 웹 크롤러를 활용해보자
1
무료앱과 유료앱에 해당하는 URL을 입력한 후,
원하는 정보들을 추출해 보자
2
화면 옆에 웹 크롤링을 위한 툴바(Tool bar)를 활용하여 '상세 페이지' 정보를 추출해본다.
추출하고자 하는 정보는 별점과 리뷰 !!
3
오늘도 몇번의 클릭으로 추출 완료!!
추출된 파일들을 보며,
평점이 3.5 미만인 그룹1 과 3.5 이상인 그룹2로 나누어본다.
4
무료 앱은3.5미만의 별점을 준 68건의 리뷰와 3.5이상의 별점을 중 135건의 리뷰
유료앱은 3.5미만의 별점을 준 36건의 리뷰와 159건의 리뷰가 준비 되었다
5
이제 각 그룹에서 많이 나오는 '명사' 단어들을 뽑아
그룹간의 차이가 얼마나 큰지 확인해보려고 한다.
우선, 무료앱의 2리뷰 그룹 단어를 뽑았다!
(별점 3.5 미만)
(별점 3.5 이상)
대략적으로 봤을 때는 비슷해보이지만
자세히 보면 차이를 알 수 있기는 하다.
별점 3.5 이상도 여전히 부정적인 표현들이 많지만
가장 극단적인 '최악', '취소' 등의 단어가 덜 보이는 것 같기도 하다.
하지만 여전히 '삭제', '문제' 등의 단어를 찾아볼 수 있다.
6
다음으로, 유료앱의 2리뷰 그룹 단어를 뽑았다!
(별점 3.5 미만)
(별점 3.5 이상)
유료앱의 별점 3.5 이상에서도 여전히
'환불', '문제' 등의 부정적인 단어들을 찾아볼 수 있다.
하지만 3.5미만에서는
실질적인 문제의 내용인 '버그', '오류' 등이 확연하게 보인다.
부정적인 단어들의 정도의 차이가 있기는 하지만
전반적으로 높은 별점에서도 부정적인 내용들이 많이 나타나는 것을 발견했다.
실제로 아래와 같이 점수는 높지만 컴플레인에 가까운 내용들을 찾을 수 있다.
최근 별점테러, 별점조작 등의 이슈로 별점을 폐지해야한다는 목소리가 커지고 있다.
소비자에게 정확한 정보를 전달할 수 있고 서비스 제공자에게도 공정한 평가 시스템을 고민해봐야겠다.
웹크롤링하는 한과장은 별점5점?!!
Comments