이번에는 데이터바우처 지원사업 사례를 소개합니다.
AI 활용 맞춤형 상품 추천 서비스를 위해 데이터를 웹크롤링하고 가공하여 제공한 사례입니다.
이번에 소개해드릴 데이터 바우처 수요기업은 운동/다이어트 보조제 추천 서비스를 개발하는 C사입니다.
제품과 소비자를 연결해 주는 제품 추천 애플리케이션을 통한 제휴 마케팅을 주요 사업 모델로 하고 계셨는데요. 제품 데이터를 준비하는 과정에서 오프라인 자료수집과 데이터 번역을 위해 많은 시간이 소요되고, 사진 데이터를 직접 확인해야 하는 등의 어려움을 겪고 계셨습니다. 아마도 데이터 수집 및 가공 기술이 부족한 기업들에서 쉽게 만나게 될 난관 같은데요.
데이터 바우처 지원사업을 통해 저희 유펜솔루션과 함께 문제 해결 방안을 모색해보았습니다.
| 수요기업: AI 활용 맞춤형 상품 추천 서비스를 위한 데이터 수집 및 가공 필요
C사에서는 운동/다이어트 보조제 소비자들이 겪는 문제를 해결하고자 했습니다. 소비자들은 유사 제품들이 너무나도 많은 상황에서 허위ㆍ과대 광고와 부작용에 대한 설명 부족 등 자신에게 알맞고 안전한 제품 선택에 어려움을 겪고 있는 상황이었죠. 그래서 제품 정보를 비교 분석하여 개별 진단을 통한 인공지능 기반 맞춤형 상품 추천 서비스 개발을 기획했습니다. 먼저, 개인별 프로파일링을 기반으로 개인에게 최적화된 제품 추천 서비스 모델 개발을 위해 기반 데이터 수집이 필요했는데요. 운동/다이어트 보조제에 대한 정보를 수집하려면 다양한 사이트를 직접 방문해야 했기 때문에 어려움을 겪고 계셨습니다. 또 제품의 용량이나 성분·영양표 등이 비정형 형태인 이미지로 제공되는 경우가 많았습니다. 그래서 이미지 형태의 비정형 데이터를 텍스트 형식의 정형 데이터로의 가공하여 제품군 추천에 필요한 제품 상세 분류를 위한 인공지능 모델에 적용하는 것 또한 필요한 상황이었죠.
| 공급기업: 데이터 수집 및 가공을 통한 인공지능 기반 제품 상세 분류 모델 수립
저희 유펜솔루션에서는 수요기업의 요구 사항에 맞춰 제품 분류를 위한 인공지능 알고리즘 모델링에 필요한 데이터를 수집 후 가공해드렸습니다. 먼저 쿠팡, 아이허브 등의 웹 사이트에서 판매 중인 운동 및 다이어트 보조제의 ‘제품명, 제품 성분, 브랜드, 제품의 맛과 용량, 가격, 해당 제품 링크’등의 데이터를 수집하였습니다. 또한 상품 정보를 수집해 원천 데이터를 구축하고, 데이터 라벨링을 통해 AI 모델링에 필요한 라벨링 된 데이터셋을 구축했습니다. 이후, 텍스트 추출 알고리즘, 외국어 번역 알고리즘, 제품 소분류 알고리즘 등을 활용해 AI 모델링을 시행하였습니다.
| 맺음말
AI 기술 활용 제품 또는 서비스 개발 등에 필요한 데이터셋 구축, 가공 서비스가 필요하시다면 언제든 저희 유펜솔루션에 편히 문의해 주세요.
Comments