top of page
[데이터 분석] 맥도날드 VS. 버거킹
데이터를 수집하고 분석하면 우리가 알지 못했던 인사이트를 얻을 수 있습니다. 데이터의 수집과 분석은 유펜솔루션과 함께 하세요!
[데이터 분석] MLB, 포스트시즌의 최강 팀은?
2024년 3월 20일 서울 시리즈를 시작으로, 올해 미국 프로야구 메이저리그 베이스볼(MLB)이 개막했습니다. 정규 시즌의 승리와 포스트시즌의 승리를 분석하여, 어떤 팀이 포스트시즌에서 강한지 또는 약한지 분석한 사례를 소개합니다....
[데이터 분석] 2024 미국 대선의 승부처
[서문] 2024년은 미국 대통령 선거의 해입니다. 데이터를 통해 미국 대통령 선거를 분석합니다. 핵심 주제는 선거 운동에서 우선순위가 높은 주를 어떻게 규정할 것인가입니다. 접근법은 두 가지로서, 첫 번째는 주별 선거인단 수의 분포와 선거...
[데이터 스토리텔링] 미국 여성의 세대별 결혼 비율
미국 여성의 세대별 결혼 비율을 시각화한 사례입니다. 특히 1980년대와 1990년대에 태어난 미국 여성들이 그 이전 시기에 태어난 미국 여성들에 비해 결혼 비율이 어떻게 다른지에 초점을 맞추었습니다. 위 그래프의 Y축은 결혼한 적이 있는 여성의...
[데이터 스토리텔링] 아마존, 유통 기업을 넘어서
아마존의 회계연도 2023의 매출액 5,540억 달러의 부문별 비중을 시각화한 사례입니다. 1년 매출액 중에서 부문별 비중이 높은 순서대로 살펴보았습니다. 1. 전자상거래 (Online Store) 40.8% : 2,259억 달러 2. ...
[데이터 스토리텔링] 밀라노의 녹지 분포는?
이탈리아의 밀라노는 면적이 1,500제곱 킬로미터, 인구는 320만 명 정도 되는 롬바르디아 주의 주도이자 이탈리아의 경제 수도로 인식되는 국제적인 도시입니다. 위 이미지는 데이터 기술을 활용하여 밀라노의 녹지 분포를 시각화한 결과물입니다....
[데이터 스토리텔링] 가자 지구 인구밀도 시각화
가자 지구의 인구밀도를 시각화하여 런던과 비교해 본 사례입니다. 평균 인구밀도라는 기준으로만 보면 런던 (제곱킬로미터 면적당 평균 5,601명)과 가자 지구 (제곱킬로미터 면적당 평균 5,751명)가 비슷합니다. 하지만 시각화를 통해 보면 다른...
[데이터 스토리텔링] 시기별, 연령별, 주별 미국인 주요 사망 원인
미국인의 주요 사망 원인을 2001년-2002년 데이터 (이하 과거)와 2020년-2021년 데이터 (이하 최근)의 비교를 통해 알아 본 사례입니다. [1세부터 17세까지의 미성년] 과거에는 교통사고가 지배적이었으나, 최근에는 교통사고 이외에도...
[데이터 분석] Yelp 스크래핑을 통한 버블티 산업 탐구
버블티는 대만에서 시작되어 2000년대 초반부터 전 세계적으로 인기가 높아졌습니다. 시장은 오늘날까지도 빠른 성장세를 이어가고 있습니다. 미국에서 이 시장에 대한 통찰력을 얻기 위해 이 프로젝트는 미국 내 인구가 많은 상위 10개 도시에 있는...
[데이터 분석] 메디케어 센터 약물 지출 및 분석
배경 당뇨병은 국민들에게 가장 크게 영향을 미치는 만성 질환입니다. CDC에 따르면 3,700만 명의 미국인이 당뇨병을 앓고 있으며 9,600만 명(미국인 3명 중 1명)이 당뇨병 전단계에 있으며 당뇨병 발병 위험이 큽니다. 이 만성 질환은 심장...
[데이터 스토리텔링] 유튜브에서 최다 구독자를 보유한 뮤지션은?
2023년 8월 현재, 유튜브의 artists/bands 채널에서, 가장 많은 구독자를 보유한 채널 데이터를 시각화한 사례입니다. 블랙핑크와 BTS라는 반가운 이름이 1위와 2위에 올라와 있습니다. 2023년 9월 6일 기준, 블랙핑크는...
[데이터 분석] 뉴욕의 CitiBike 공급 및 수요
리밸런싱이란? 국내 최대의 자전거 공유 프로그램인 씨티바이크는지하철과 택시 서비스에 비해 훨씬 저렴하고 지속할 수 있는 대안을 마련했습니다. 뉴욕시와 뉴저지 전역의 1,500개 스테이션에 25,000대 이상의 자전거 네트워크가 분산된 씨티바이크의...
[데이터 분석] 2023년 트위터 스크래핑
Twitter는 가장 인기 있는 소셜 미디어 플랫폼 중 하나로, 매일 수백만 명의 사용자가 자신의 생각과 의견을 트윗하고 공유합니다. 그 결과 Twitter는 사용자 행동, 정서 및 추세를 분석하려는 기업, 연구원 및 개발자에게 귀중한 데이터...
[데이터 분석] 은행 디지털 마케팅신용 위험 분류 모델
I. 신용 위험 분류 모델 이해: 1. 정의 및 중요성: 신용 위험 분류 모델은 신용도를 기준으로 고객 또는 대출자를 식별하고 분류하는 데 도움이 되는 예측 모델입니다. 이러한 모델은 과거 데이터, 고객 특성 및 재무 지표를 활용하여 채무 불이행...
[데이터 시각화] 2022 카타르 월드컵 최종 결과
2022년 12월 19일 (한국시간), 아르헨티나의 우승으로 2022 카타르 월드컵이 막을 내렸습니다. 16강부터 8강, 4강, 3-4위전 및 결승에 이르기까지의 4단계 결과를 시각화해 본 사례입니다. 방사형 (radial bracket)...
[데이터 분석] 스타벅스 고객 세분화를 통한 데이터 기반 광고
인트로 Starbucks는 미국에 15,000개 이상의 매장을 보유한 수십억 달러 규모의 회사로 연간 수천만 명의 고객에게 서비스를 제공합니다. 스타벅스는 단순히 커피, 스낵, 가벼운 식사를 제공하는 곳이 아닙니다. 이 상태를 유지하기 위해...
[데이터 분석] 노래 가사 감성 분석
어떤 노래가 어떤 감성을 표현하고 있을까? 다섯 곡의 팝 명곡을 가사 감성 분석을 통해 살펴보았습니다. 감성 분석 (Sentiment Analysis)은 텍스트에 나타난 의견, 평가, 태도와 같은 주관적인 정보를 분석하는 것을 의미합니다....
[데이터 분석] 인스타그램 광고 수익 최고는 누구?
배경 인스타그램이 단순한 무료 사진 공유 플랫폼에서 거대한 광고 플랫폼으로 전환하고 있습니다. 인스타그램 광고 시장이 커지면서, 인스타그램 인플루언서와 대중 스타들의 광고 수익도 커질 것으로 예상됩니다. 몇 가지 데이터를 조합하고 분석하여...
[데이터 분석] 데이터를 통해 살펴본 인플레이션과 물가 상승
2022년의 화두 중 하나는 인플레이션입니다. 예년 1%~2% 수준이던 미국 인플레이션 12개월 선행 지수가 2022년 8월 현재 8.3%를 기록하고 있습니다. 이번 포스팅의 초점은 몇 가지 데이터 분석과 시각화를 통해 살펴본 인플레이션의...
[데이터 분석] 유럽 정치인 트위터 크롤링
트위터에서 인기 있는 유럽 정치인은 누구일까요? 유럽 정치인의 개인 트위터 계정들을 크롤링 하여 분석하고 시각화한 사례를 소개합니다. 유럽 정치인의 개인 트위터 계정들에서 (1) 팔로워 수 (2) 전체 트윗 (3) 트윗별 좋아요 수만 크롤링 하면...
bottom of page