웹 크롤링하는 한과장
'고객들의 Q&A 내용을 키워드 태그(Tag)로 분류해보자'
웹 크롤링을 활용한 고객관리
집에서 독립을 꿈꾸는 한과장
오늘도 자신만의 공간을 꾸미기 위한 아이템 쇼핑몰을 구경하고 있다.
인테리어 및 소품 관련하여 수많은 문의사항이 있다는 점을 발견한 한과장
온라인 쇼핑몰에서 문의사항을 효율적으로 관리하기 위해 태그(Tag)를 통해 분류하는 것이 흥미롭다.
?
“각 제목과 내용은 어떤 키워드로 분류되고 있을까?”
“앞으로는 어떻게 분류되는 것이 좋을까?”
온라인 쇼핑몰 Q&A 섹션에서 각 질문들이 어떻게 태그(Tag)를 통해 분류되었는지 확인해본다.
우선 태그되는 키워드의 종류는 아래와 같다.
질문답변(Q&A) 섹션은 질문, 질문에 해당되는 태그 그리고 답변으로 구성되어 있다.
Q&A 섹션의 질문과 키워드 태그를 크롤링하여
각 제목과 내용에는 어떤 키워드가 적용되었는지 알아보자
스파이더킴 웹 크롤러를 활용해보자
1
우선, 온라인 쇼핑몰의 Q&A 페이지 URL을 넣는다!!
2
웹 크롤링을 위한 툴바(Tool bar)의 시작페이지 데이터 추출을 활용하여
크롤링하고자 하는 질문 제목, 내용, 키워드 태그를 추출한다.
오늘은 5페이지 정도를 추출하여 25개 질문의 키워드를 알아보자!!
3 웹 크롤링 프로젝트를 등록하고 데이터 추출이 완료되기까지 기다려본다
...
...
완료!!
4
okt.morphs, okt.phrases 를 활용하여
각 문의사항의 제목과 내용을 형태소(morphs)와 어구(phrases)로 뽑아보자
5
문의사항 제목과 내용의 어구와 형태소를 확인하고 해당되는 키워드 태그를 확인해보자!!
그리고 각 태그별로 어떤 내용들을 확인할 수 있는지 엑셀에서 피벗 테이블(Pivot Table)을 만들어본다.
데이터에 포함되어 있는 키워드 태그는 아래와 같다.
태그별로 내용을 모아놓은 피벗 테이블!!
6
위의 내용을 정리해보면 아래와 같은 표가 만들어진다
"웹 크롤링으로 Q&A 내용과 키워드 태그 수집하여 분석 완료!!"
느낀점
① 키워드를 나누는 기준이 좀 더 명확하면 좋을 것 같다.
② 마케터로서 해당 문의와 키워드를 활용하면 특정 그룹의 소비자들이 어떤 니즈를 갖고 있는지 알 수 있다.
③ 고객들이 주로하는 고민을 따로 분석하여 해당 부분을 해결할 수 있는 상품 개발 및 맞춤형 서비스를 만들면 좋을 것 같다.
④ 주거 공간을 건축할 때 위의 고민들이 줄일 수 있는 공간을 만들면 입주하고자 하는 사람들이 더욱 많아질 것 같다.
⑤ 문의사항을 키워드로 태그한 데이터가 계속해서 많이 쌓이면 머신러닝(machine learning) 모델에 학습시켜 classification도 가능해지겠다!!
역시 제대로된 수집은 중요해
주섬주섬
コメント