많은 뉴스 기사를 키워드로 압축하여 매일 수집할 수는 없을까?
유펜솔루션이 고객사의 의뢰를 받아, 빅카인즈 (https://www.bigkinds.or.kr/)에서 오늘의 뉴스 키워드를 크롤링 한 사례를 소개합니다.
· 수집 주기 : 매일 오후 2시
· 수집 대상 : 전체에서 50개 키워드, 각 분야별 상위 10개 키워드
· 결과 보고 : API를 통해 고객사 DB에 전송
구축된 데이터 셋의 예시는 아래와 같습니다. 오늘의 뉴스는 매일 50개의 키워드가 제공되는데, 이를 수집하여 상위 순위로 정렬하고 고객사 DB에 전송합니다.
오늘의 뉴스는 전체뿐만 아니라 정치, 경제, 사회, 문화, 국제, 지역, 스포츠, IT 과학의 8개 분야별로 매일 50개 키워드가 제공됩니다. 분야별 키워드는 상위 각 10개 키워드를 수집하여 고객사 DB에 전송합니다.
일별 뉴스 키워드를 50개씩 크롤링 하여 DB로 구축한다면, 그 활용 가치가 무궁무진할 것입니다. 고객사의 빅데이터 활용과 데이터 가치 창출에 응원을 보내드립니다. 뉴스 데이터의 수집과 가공은 유펜솔루션과 상의해 주세요!
Commentaires