Analysis Report/그로스 해킹 7

아이리스 데이터를 이용한 군집화 분석

군집화는 비지도 학습에 속하는 알고리즘으로 비슷한 샘플 클러스터로 모으는 것입니다. 비슷한 행동을 하는 고객을 동일한 클러스터로 분류하는 고객 분류, 동일한 클러스터 내의 고객들이 좋아하는 컨텐츠를 추천하는 추천 시스템, 제시된 이미지와 비슷한 이미지를 찾아주는 검색 엔진, 차원 축소를 이용하여 분석을 위한 충분한 정보를 가질 수도 있습니다. 또한 이상치도 탐지할 수 있습니다. 만약 레이블 된 샘플이 적다면 군집화를 활용하여 클러스터를 만들고 동일한 클러스터에 있는 모든 샘플에 동일한 레이블을 부여하여 지도 학습의 성능을 높일 수도 있습니다. 정말 다양하게 사용할 수 있는 유용한 알고리즘이며 글쓴이 같은 경우 마케팅, 그로스해킹에 관심이 있기 때문에 고객을 동일한 클러스터로 분류하거나 클러스터 내의 고객..

타겟 마케팅

확실한 타겟을 선정해야 브랜드의 제품이나 서비스의 광고 효과를 극대할 수 있습니다. 잘못된 타켓의 설정으로 전체적인 마케팅 플랜이 무너질 수 있으니, 타켓 설정은 탄탄히 해야 합니다. 이러한 이유로 오늘 분석은 고객 데이터 분석을 통한 고객 세그먼트 도출입니다.   **데이터 설명***   CustomerID: 고객들에게 배정된 유니크한 고객 번호입니다.*   Gander:  고객의 성별입니다.*   Age: 고객의 나이입니다.*   Annual Income: (k$):고객의 연소득 입니다.*   Spending Score (1-100): 고객의 구매행위와 구매 특성을 바탕으로 mall에서 할당한 고객의 점수 입니다.  상관관계 분석(히트맵)import seaborn as snssns.heatmap(df..

A/B Test

혹시 AARRR에 대해서 아시나요. 저는 마케팅 분석, 그래스 해킹에 관심이 있어 요즘 많이 찾아보고 있습니다.간단하게 설명 드리기 전  일단 퍼널 분석과 전환을 알아야 합니다. 여기서 전환은 마케팅 목적으로 고객에게 기대되는 일련의 행동을 뜻하는데 많은 기업에서 전환의 기준을 '구매'로 설정하지만, 전환은 기업의 목표나 특성에 따라 회원가입, 구독 신청 등으로 설정될 수 있습니다. 퍼널 분석은 잠재 고객의 유입부터 전환에 이르기까지 고객의 여정을 분석하는 모델입니다. 모든 서비스와 비즈니스는 다음 단계로 넘어갈수록 이용자 수가 줄어듭니다. 처음 유입된 고객중에서 일부만이 서비스에 관심을 갖고, 관심을 가지는 고객중 일부만이 실제 구매까지 하게 되는 것이죠. 이렇게 단계가 넘어갈수록 이용자가 줄어드는 모..

광고 매출 분석

실제로는 광고 매체비 이외의 많은 요인이 매출에 영향을 미칩니다. 본 분석에서는 다른 요인이 모두 동일한 상황에서 매체비 만 변경했을 때 매출액의 변화가 발생한 것이라고 간주해 봅니다. 각 미디어별로 매체비를 어떻게 쓰느냐에 따라서 매출액이 어떻게 달라질지 예측하며 궁극적으로 매출액을 최대화할 수 있는 미디어 믹스의 구성을 도출할 것입니다. **데이터 설명** --- * TV:TV 매체비 입니다. * radio:라디오 매체비입니다. * newpaper:신문 매체비입니다. * sales:매출액 입니다. 매출과 매체비의 히트맵 import seaborn as sns sns.heatmap(df.corr(), annot=True) - 매출과 상관성이 높은 것은 TV > Radio > Newspaper 순서입니다..

이커머스 데이터 활용 지표 개발

A사는 오픈마켓 플랫폼을 운영 중입니다. 런칭 이후 사용자들이 빠르게 상승하였지만, 현재는 정체기에 빠져있습니다. 현재 서비스 이용 수준이 어떻게 되고 있으며 런칭 이후 어떻게 변해왔는지를 파악하기 위해 다양한 분석을 수행하고자 합니다. 분석 목표RFM Model  -최근성(Recency), 구매빈도(Frequency), 구매금액(Monetary)의 3가지 지표들을 통해 고객 점수 부여 및 등급화  Recency(최근성) 최근성--InvoiceDate변수에서 년, 월만 추출 후 새로운 Date 변수 생성df['Date']=df['InvoiceDate'].str.split(' ').str[0]df['Date']=pd.to_datetime(df['Date'])##고객의 마지막 구매 날짜recency_df=d..

고객 구매 여정 분석

최근 고객의 페이지 클릭수, 이탈률, 종료율을  데이터를 바탕으로  UX를 개선하려고 합니다 Page 관련 데이터  EDA 이후 이탈률, 종료율 높은 사용자 여정 탐색하고 개선이 필요한 단일 페이지 및 사용자 개선  포인트 탐색하겠습니다Page 관련 데이터 EDA이탈률:해당 페이지에서 아무런 행동도 하지않고 이탈한 비율종료율:해당 페이지가 탐색에 마지막 페이지가 된 비율 페이지에 관련된 변수들에 대한 데이터 프레임을 생성하겠습니다df_cus = df[['Administrative', 'Informational', 'ProductRelated', 'BounceRates', 'ExitRates', 'PageValues']]df_cus.head(5)df_cus = df_cus.groupby(['Administ..

리그오브레전드 승리 요인 분석

분류 주제는 리그오브레전드의 승리 공식 인사이트를 얻기 위함과 승리예측 분류 모델을 만드는 것입니다.  - 각 파일의 컬럼은 아래와 같습니다.    gameId: 게임 판의 고유 ID    blueWins: 블루팀의 승리 여부 (0: 패배, 2:승리)    xxxWardsPlaced: xxx팀에서 설치한 와드의 수     xxxWardsDestroyed: xxx팀에서 파괴한 와드의 수    xxxFirstBlood: xxx팀의 첫번째 킬 달성 여부    xxxKills: xxx팀의 킬 수    xxxDeaths: xxx팀의 죽음 수    xxxAssists: xxx팀의 어시스트 수    xxxEliteMonsters: xxx팀이 죽인 엘리트 몬스터 수    xxxDragons: xxx팀이 죽인 용의 수 ..