top of page

[스파이더킴] 청와대 국민청원 웹 크롤링으로 사회 현안 알아보기


요즈음 국민 청원 게시판을 통해 자신의 의사를 전달하고자 하는 시민들이 늘어나고, 이에 동의의 뜻을 표하며 여론이 형성되는 양상이 특징적입니다. 그렇다면, 국민 청원 게시판을 통해 사회 현안 및 여론을 파악하는 것이 가능할까요?



대학생 A 씨는 ‘주요 사회 문제 분석’이라는 과제를 부여받았습니다.

A 씨는 구체적인 사회 이슈 파악을 위한 사전 조사로, 현재 국민들이 정부에 직접적인 대응을 요구하는 수준의 사회 분야를 알아보기 위해 국민청원 게시판을 이용하기로 했습니다. 국민청원 게시판에서 현재 진행 중인 청원의 ‘분류’, ‘청원 제목’, ‘참여 인원’ 정보를 모두 가져와 분석하고자 합니다. 데이터 수집은 스파이더킴을 이용하여 쉽게 진행할 수 있었습니다.



웹 크롤링 데이터는 엑셀 파일 형태로 다운로드했습니다. 웹 크롤링을 통해 얻은 엑셀 파일로 각 이슈 분류별 참여 인원과 청원 개수 및 평균을 산출해보았습니다. 그리고 이 데이터들을 바탕으로 사회의 어느 분야에서 국민들이 불편함을 겪고 있는지를 파악해보았습니다.



먼저 이슈 분류별 청원 개수를 통해 어느 분야에서 청원이 가장 많이 제기되었는지를 파악했습니다.

하지만 국민 청원 게시판에 올라온 글들은 개인의 단순 의견일 수 있고 다수가 공감하는 의견인지 정확히 알기 어렵기 때문에, 이를 국민 전체 의견을 반영하는 지표라고 확정할 수는 없었습니다.

따라서 대학생 A 씨는 각 이슈 분류별 참여 인원의 합을 확인했습니다. 그리고 참여 인원의 합이 높은 카테고리가 국민들이 많은 불편함을 느끼는 사회적 이슈라고 판단했습니다. 그러나 참여 인원의 합은 청원의 개수에 영향을 받을 수밖에 없다는 점도 고려해야 합니다.



예를 들어 아래 표의 보건복지 분야와 안전/환경 분야를 비교해봅시다. 게시물 수는 보건복지 분야가 안전/환경의 약 2배이지만 전체 참여인원은 그에 비해 근소한 차이를 보이는 것을 알 수 있습니다.

따라서 대학생 A 씨는 청원 개수별 참여인원 평균을 분석했습니다. 그리고 평균이 높은 이슈 분류가 국민들이 가장 불편함을 느끼는 사회 분야라고 결론지었습니다.



대학생 A 씨는 스파이더킴 웹 크롤링을 통해 엑셀 파일로 데이터를 제공받고, 이를 활용하여 사회 이슈가 대두되는 분야를 살펴보는 사전조사를 쉽게 진행할 수 있었습니다.


스파이더킴을 활용해 국민들의 다양한 의견을 확인해보세요.






Comments


bottom of page