서론
유기 동물 보호 문제는 우리나라에서뿐만 아니라 전세계적으로 관심이 많은 문제입니다. 지금 이 순간에도 수십 마리의 반려 동물들이 유기되고 죽음의 위기에 내몰리고 있습니다. 모든 동물을 구조하고 좋은 가정에 입양 보낼 수 있다면 좋겠지만, 안타깝게도 보호소의 수용 가능 마리 수에는 한계가 있죠. 오늘은 우리나라의 ‘포인핸드’ 같은 동물 보호소 및 입양 중개 플랫폼인 ‘Petfinder’의 데이터를 분석하여 고양이를 성공적으로 입양 보내는 법에 대해 탐구해볼게요.
데이터 수집
Selenium을 사용하여 뉴욕 시에서 25마일 이내의 고양이 데이터를 스크랩했습니다. 보호 기간에 다른 분류인데 차례로 1일에서 6일, 7일에서 13일, 14일에서 30일, 30일 초과, 그 외 순입니다. 우리 분석에서는 30일 이내에 등록되어 있는 개체가 입양 확률이 높다고 가정합니다. 등록된 지 30일이 지난 개체는 긴 기간 동안 선택을 받지 못했다는 것을 의미하기 때문입니다.
데이터 분석
1. 많은 고양이들이 재등록되지만 대부분 2번에서 끝납니다. 보호기간의 유한성 때문일 확률이 높으나, 그렇지 않고 여전히 보호되고 있다면 보호소에서 좀 더 주의해서 더 많은 홍보를 했으면 좋겠네요.
2. 아래의 그래프는 30일 미만과 이상으로 분류된 고양이 나이별 분포도입니다. 비율을 확인해보면 30일 미만에서는 Kitten(아기 고양이)가 차지하는 비율이 50% 이상으로 매우 높지만 30일 이상에서는 Adult(성체 고양이)가 차지하는 비율이 가장 높다는 것이 보입니다. 사람들은 대체로 아기 고양이 입양을 더 선호한다는 것을 알 수 있습니다.
3. 다음으로 개체 설명란의 단어 수를 분석해보았습니다. 30일 미만 집단은 평균 86개, 30일 이상에서는 평균 108개인데요. 좋은 정보를 담아 예비 입양자들을 설득하는 것도 중요하지만, 간결하게 필요한 정보만 전달할 필요가 있다는 것도 보여줍니다.
4. 장모(DLH)에 대한 선호가 단모(DSH)에 비해 약간 높습니다. 장모에 비해 단모 개체가 압도적으로 많은데 30일 이상 집단에서는 장모의 비율이 더 줄어드는 것으로 보아 비교적 입양이 잘 된다는 것을 확인할 수 있죠. 아래의 비율로도 확인할 수 있지만 장모는 상대적으로 희귀종에 해당하기 때문입니다.
결론
분석을 통해 얻어낸 인사이트는 다음과 같습니다.
✅ 단모보다는 장모에 대한 수요가 높다.
✅ 필요한 정보를 담되, 너무 긴 글은 흥미도를 낮출 수 있다.
✅ 아기 고양이에 대한 선호도가 높다
오늘은 동물 보호소의 데이터를 분석해 인사이트를 얻어보았습니다. 직접 데이터를 스크랩하고 분석하면 더 다양한 정보를 얻을 수 있습니다. 다음에도 유용한 분석으로 돌아올게요😊
출처
https://nycdatascience.com/blog/student-works/web-scraping/getting-cats-adopted-on-petfinder-com/
데이터를 바탕으로 연구해보고 싶은 분야가 있으신가요? 스파이더킴을 통해 간편하게 원하는 데이터를 수집해보세요!
Comments