목록Likelion AI School 8기 (4)
뒤죽박죽 데이터분석 일기장

안녕하세요! 이번 포스트에서는 멋쟁이 사자 AI School 8기 14주차에 배웠던 내용을 복습해 보려고합니다. 이번주에 배운 내용은 실습 파일 : 0603, 0701, 0702 (개인적으로 복습할 때 인지하려고 기재했습니다.) 🧑💻 이번주에 배운 내용 Label Smoothing Gradient Boosting Machine XGBoost CatBoost LightBGM 하나하나씩 천천히 정리해 보면서 복습해 보겠습니다. 🔥 Label Smoothing Label smoothing은 출력 분포 정규화의 한 형태로, over confident output에 불이익을 주기 위해 학습 데이터의 실측값 라벨을 부드럽게 하여 neural network의 over-fitting을 방지합니다. 정리하자면, 훈련시..

안녕하세요! 이번 포스트에서는 멋쟁이 사자 AI School 8기 13주차에 배웠던 내용을 복습해 보려고합니다. 이번주에 배운 내용은 실습 파일 : 0502, 0503, 0601, 0602 (개인적으로 복습할 때 인지하려고 기재했습니다.) 🧑💻 대략적으로 배운 내용 1. 머신러닝의 이해 2. 머신러닝 라이브러리인 Scikit-learn에 내재되어 있는 모델의 종류 3. 머신러닝 평가 4. 모델링 해석 5. Cross validation 6. 하이퍼 파라미터 튜닝 하나하나씩 천천히 정리해 보면서 복습해 보겠습니다. 🔥 머신러닝의 이해 머신러닝 알고리즘의 유형 범주형 수치형 지도학습(정답 있음) 분류 (classification) 회귀 (regression) 비지도 학습(정답 없음) 군집화 (cluster..

안녕하세요! Likelion AI School 8기 12주차 WIL을 작성해 보도록 하겠습니다. 코호트 분석 : 고객 세분화를 '시간의 흐름'을 기준으로 하는것을 말합니다. [출처] : https://datarian.io/blog/cohort-analysis 한 예시로 들어보자면 어떤 플랫폼 사용자의 이용횟수를 알고 싶다면 시간대 별 이용자라는 코호트(집단)으로 나누어서 가장 최근의 날짜부터 가장 처음 이용횟수를 월별로 살펴보는 것입니다. 그러고 이를 잔존율이라고 합니다. 코호트 분석에서 잔존율을 구할 때 저는 위의 데이터를 사용했습니다. 이 때 필요한 column은 InvoiceDate(주문일자)와 CustomerID(고객번호)입니다. 판다스에서 groupby를 사용해 CustomerId로 묶고 cou..

안녕하세요! 오랜만에 다시 마음을 잡아 블로그에 작성하기로 마음을 먹었습니다. 앞으로 저의 목표는 다시 1일 최소 1 포스트로 더 활발한 활동 보여드리겠습니다. 이번 포스트는 멋쟁이 사자 AI School 8기 11주차에 배운 내용을 정리하는 WIL 포스트를 작성해 보도록 하겠습니다. 이번주에는 '비즈니스 데이터 분석'라는 주제를 가지고 수업을 진행했습니다. 개념 정리 마케팅 용어 정리 CAC CPA CPL LTV 번역 고객 확보 비용 확보 고객당 비용 플랫폼 별 확보 고객당 비용 고객 생애 가치 영어 Customer Acquisition Cost Cost per acquisition Cost per lead (Customer) Lifetime value 의미 유료 결제 고객 1명 확보에 들어간 비용 개..