top of page
[데이터 분석] MLB, 포스트시즌의 최강 팀은?
2024년 3월 20일 서울 시리즈를 시작으로, 올해 미국 프로야구 메이저리그 베이스볼(MLB)이 개막했습니다. 정규 시즌의 승리와 포스트시즌의 승리를 분석하여, 어떤 팀이 포스트시즌에서 강한지 또는 약한지 분석한 사례를 소개합니다....
[데이터 분석] 2024 미국 대선의 승부처
[서문] 2024년은 미국 대통령 선거의 해입니다. 데이터를 통해 미국 대통령 선거를 분석합니다. 핵심 주제는 선거 운동에서 우선순위가 높은 주를 어떻게 규정할 것인가입니다. 접근법은 두 가지로서, 첫 번째는 주별 선거인단 수의 분포와 선거...
[고객사 사례] 자사 제품 온라인 쇼핑몰 가격 모니터링
한 전자제품 제조, 유통 고객사에 자사 제품 온라인 쇼핑몰 가격 모니터링 시스템을 구축해 드린 사례를 소개합니다. 자동화된 크롤링 시스템이, 자사의 전자제품 모델명 68개를 16개 온라인 쇼핑몰에 투입하여 주 3회 모델명 별, 온라인 쇼핑몰 별...
[고객사 사례] 음식점 데이터 크롤링
대한민국의 음식점 데이터는 모두 웹에 있다! 고객사 의뢰를 받아, 음식점 데이터를 수집한 사례를 소개합니다. 포털 사이트를 크롤링 하여 총 62만여 건의 음식점 데이터를 수집했습니다. 음식점명, 음식점의 대분류와 소분류, 주소, 포털 URL,...
[데이터 스토리텔링] 미국 여성의 세대별 결혼 비율
미국 여성의 세대별 결혼 비율을 시각화한 사례입니다. 특히 1980년대와 1990년대에 태어난 미국 여성들이 그 이전 시기에 태어난 미국 여성들에 비해 결혼 비율이 어떻게 다른지에 초점을 맞추었습니다. 위 그래프의 Y축은 결혼한 적이 있는 여성의...
[데이터 스토리텔링] 아마존, 유통 기업을 넘어서
아마존의 회계연도 2023의 매출액 5,540억 달러의 부문별 비중을 시각화한 사례입니다. 1년 매출액 중에서 부문별 비중이 높은 순서대로 살펴보았습니다. 1. 전자상거래 (Online Store) 40.8% : 2,259억 달러 2. ...
[데이터 스토리텔링] 밀라노의 녹지 분포는?
이탈리아의 밀라노는 면적이 1,500제곱 킬로미터, 인구는 320만 명 정도 되는 롬바르디아 주의 주도이자 이탈리아의 경제 수도로 인식되는 국제적인 도시입니다. 위 이미지는 데이터 기술을 활용하여 밀라노의 녹지 분포를 시각화한 결과물입니다....
[회사 소식] 유펜솔루션, 웨비나 참가 '2024 데이터로 알아보는 소비 트렌드'
유펜솔루션이 웨비나에 참가합니다. 데이터 기반 시장 조사, 트렌드 분석이 기업 내 전략 수립과 실행에 매우 중요한 요인이 되고 있는 사회입니다. 온라인에서 쉽게 접할 수 있는 정보를 의미 있는 데이터로 수집 및 분석하고, 설득력 있는 보고서로...
[데이터 스토리텔링] 가자 지구 인구밀도 시각화
가자 지구의 인구밀도를 시각화하여 런던과 비교해 본 사례입니다. 평균 인구밀도라는 기준으로만 보면 런던 (제곱킬로미터 면적당 평균 5,601명)과 가자 지구 (제곱킬로미터 면적당 평균 5,751명)가 비슷합니다. 하지만 시각화를 통해 보면 다른...
[데이터 스토리텔링] 시기별, 연령별, 주별 미국인 주요 사망 원인
미국인의 주요 사망 원인을 2001년-2002년 데이터 (이하 과거)와 2020년-2021년 데이터 (이하 최근)의 비교를 통해 알아 본 사례입니다. [1세부터 17세까지의 미성년] 과거에는 교통사고가 지배적이었으나, 최근에는 교통사고 이외에도...
[데이터 스토리텔링] 유튜브에서 최다 구독자를 보유한 뮤지션은?
2023년 8월 현재, 유튜브의 artists/bands 채널에서, 가장 많은 구독자를 보유한 채널 데이터를 시각화한 사례입니다. 블랙핑크와 BTS라는 반가운 이름이 1위와 2위에 올라와 있습니다. 2023년 9월 6일 기준, 블랙핑크는...
[고객사 사례] 백화점 데이터 크롤링
브랜드, 유통, 마케팅 컨설팅을 전문적으로 수행하는 한 기업에서 의뢰하신 사례를 소개합니다. 국내 웹 사이트에서 국내 주요 5개 백화점에 대한 정보를 수집하고 가공하여 백화점 비즈니스에 대한 인사이트와 지향점을 도출하는 작업의 일환입니다. [5개...
[데이터 스토리텔링] 뉴스 기사에서 바비와 오펜하이머 언급량
2023년 7월 21일 (미국 시간) 동시에 개봉한 영화 바비(Barbie, 2023) 와 오펜하이머 (Oppenheimer, 2023)에 대한 관심이 뜨겁습니다. 뉴스 기사에서 두 영화가 언급된 양을 수집하여 시각화한 사례입니다. 기본적으로...
[데이터 분석] 2023년 트위터 스크래핑
Twitter는 가장 인기 있는 소셜 미디어 플랫폼 중 하나로, 매일 수백만 명의 사용자가 자신의 생각과 의견을 트윗하고 공유합니다. 그 결과 Twitter는 사용자 행동, 정서 및 추세를 분석하려는 기업, 연구원 및 개발자에게 귀중한 데이터...
[데이터 스토리텔링] 임박한 경기 침체기에 성공하는 방법
여행은 더 이상 사치가 아닙니다. 여행은 필수품입니다. 우선, 여행은 정부, 의료, 비즈니스 및 상업과 같은 이 사회에 깊이 뿌리 내리고 있습니다. 또한 소비자는 스트레스, 일상, 소진 등을 피하고자 여행을 떠납니다. 경제적 불확실성의 시기에...
[데이터 스토리텔링] 집을 소유한 자, 누구? 1980년 vs. 2021년
미국에서 연령별로 집을 소유한 사람의 비율 데이터를 수집하여 시각화한 사례입니다. 1980년 데이터와 2021년 데이터를 비교했습니다. 노란색 점선이 1980년 데이터, 파란색 실선이 2021년 데이터입니다. 1980년에는 20대, 30대,...
[데이터 스토리텔링] 미국 주 별 신앙심 현황
미국인들에게 물었습니다. “당신은 얼마나 신앙심이 깊습니까? 이 질문에 “네, 나는 신앙심이 매우 깊습니다”라고 답한 사람들의 비율을 주 별로 표현한 사례입니다. 신앙심이 매우 깊다는 대답을 한 사람들의 비율이 가장 높은 주는 미시시피 주로서 그...
[데이터 스토리텔링] 최근 100년간 미국의 인기 아기 이름
시기 별로 미국에서 인기 있는 아기 이름은 무엇일까요? 1922년부터 2022년까지 100년 동안 인기 있는 아기 이름을 여아, 남아로 구분하여 분석해 본 사례입니다. 데이터 출처는 미국 사회보장국 (Social Security...
[데이터 분석] 은행 디지털 마케팅신용 위험 분류 모델
I. 신용 위험 분류 모델 이해: 1. 정의 및 중요성: 신용 위험 분류 모델은 신용도를 기준으로 고객 또는 대출자를 식별하고 분류하는 데 도움이 되는 예측 모델입니다. 이러한 모델은 과거 데이터, 고객 특성 및 재무 지표를 활용하여 채무 불이행...
[고객사 사례] 농산물 상품 데이터 크롤링
농촌, 농산물, 농촌 경제에 관한 업무를 수행하는 한 공공기관에서 의뢰하신 사례를 소개해 드립니다. 국내 주요 5개 이커머스에서 농산물 상품 데이터를 크롤링 하여 현황을 모니터링하고, 다양한 분석을 통해 유의미한 정책적 지향점을 도출하는 작업의...
bottom of page