2019년 5월, 한 연구자 님께서 스파이더킴 (주식회사 유펜솔루션)에 연락을 주시고 프로젝트를 의뢰하여 주셨습니다.
연구 주제는 "가습기살균제"와 "라돈침대", 데이터 수집 대상 사이트는 트위터입니다.
트위터에 두 검색어를 각각 적용하여 나온 검색 결과를 최신순으로 정렬시키고,
· 게시자의 트위터 아이디
· 게시 일자와 시각
· 트윗 본문
· 개별 트윗의 세부 URL
을 수집하여 엑셀파일로 보고 드렸습니다.
트위터의 API가 수집 목적에 부합하는 결과물을 보여 주지 않아, API를 사용하지 않고 단독적인 크롤링을 시행하였습니다.
연구자님의 최초 의뢰대로, "가습기살균제"의 경우 2011년 1월 1일부터 2019년 4월 30일까지, "라돈침대"의 경우 2018년 4월 1일부터 2019년 4월 30일까지 게시된 트윗들이 잘 수집되었습니다. 해당 기간 내 "가습기살균제"의 경우 총 59,794건, "라돈침대"의 경우 총 4,648건의 트윗 모두 수집되었습니다.
트윗 본문을 잘 정제하여 아래와 같은 워드 클라우드를 만들어 보았습니다. 가습기살균제는 최다빈도 단어 500개, 라돈침대는 최다빈도 단어 1000개를 활용하였습니다.
사회적으로 큰 이슈가 되었던 두 단어, 두 사건에 대한 연구에, 많은 분들이 올려주신 트윗들과 크롤링 기술이 큰 도움이 되기를 기원합니다. 연구자님, 좋은 연구결과를 기대하겠습니다!
=========================
데이터 수집/정제/분석/시각화에서 최고의 서비스를 제공합니다.
지금 바로 홈페이지를 방문하셔서, 문의 요청해 주십시오!
Comentários