코딩 테스트/SQL (SQLD & SQLP)

프로그래머스 SQL level 5 - #1 상품을 구매한 회원 비율 구하기

PM스터 2023. 2. 8. 01:32
반응형

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

출처: https://link.coupang.com/a/bqfHaS

 

2024 이기적 SQL 개발자 이론서+기출문제

COUPANG

www.coupang.com


1. 문제 설명 

문제 설명

다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_ID, GENDER, AGE, JOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.

Column nameTypeNullable
USER_ID INTEGER FALSE
GENDER TINYINT(1) TRUE
AGE INTEGER TRUE
JOINED DATE FALSE

GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.

ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

Column nameTypeNullable
ONLINE_SALE_ID INTEGER FALSE
USER_ID INTEGER FALSE
PRODUCT_ID INTEGER FALSE
SALES_AMOUNT INTEGER FALSE
SALES_DATE DATE FALSE

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.


문제

USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율(=2021년에 가입한 회원 중 상품을 구매한 회원수 / 2021년에 가입한 전체 회원 수)을 년, 월 별로 출력하는 SQL문을 작성해주세요. 상품을 구매한 회원의 비율은 소수점 두번째자리에서 반올림하고, 전체 결과는 년을 기준으로 오름차순 정렬해주시고 년이 같다면 월을 기준으로 오름차순 정렬해주세요.


예시

예를 들어 USER_INFO 테이블이 다음과 같고

USER_IDGENDERAGEJOINED
1 1 26 2021-06-01
2 NULL NULL 2021-06-25
3 0 NULL 2021-06-30
4 0 31 2021-07-03
5 1 25 2022-01-09
6 1 33 2022-02-14

ONLINE_SALE 이 다음과 같다면

ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE
1 1 54 1 2022-01-01
2 1 3 2 2022-01-25
3 4 34 1 2022-01-30
4 6 253 3 2022-02-03
5 2 31 2 2022-02-09
6 5 35 1 2022-02-14
7 5 57 1 2022-02-18

2021년에 가입한 회원은 USER_ID가 1, 2, 3, 4 인 회원들로 총 4명 입니다. ONLINE_SALE 테이블에서 해당 회원들에 대한 판매 데이터는 다음과 같습니다.

ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE
1 1 54 1 2022-01-01
2 1 3 2 2022-01-25
3 4 34 1 2022-01-30
5 2 31 2 2022-02-09

그러므로 년, 월 별로 상품을 구매한 회원수와 상품을 구매한 회원의 비율을 구하고 결과를 정렬하면 다음과 같아야 합니다.

YEARMONTHPUCHASED_USERSPUCHASED_RATIO
2022 1 2 0.5
2022 2 1 0.3

2. 정답

SELECT YEAR(sales_date) as YEAR, 
        MONTH(sales_date) as MONTH,
        COUNT(DISTINCT O.user_id) as PUCHASED_USERS, 
        ROUND(COUNT(DISTINCT O.user_id) / COUNT(DISTINCT U2.user_id),1) as PUCHASED_RATIO

FROM ONLINE_SALE as O
    LEFT JOIN USER_INFO as U1
    ON O.user_id = U1.user_id,
    USER_INFO as U2 

WHERE YEAR(U1.joined) = 2021
    AND YEAR(U2.joined) = 2021

GROUP BY YEAR, MONTH
ORDER BY YEAR ASC, MONTH ASC;


3. 코드 설명

  • SELECT YEAR(sales_date) as YEAR, 
            MONTH(sales_date) as MONTH,
            COUNT(DISTINCT O.user_id) as PUCHASED_USERS, 
            ROUND(COUNT(DISTINCT O.user_id) / COUNT(DISTINCT U2.user_id),1) as PUCHASED_RATIO
    • sales_date의 연도를 YEAR로,
    • sales_date의 월을 MONTH로,
    • ONLINE_SALES 내역이 있는 유저들의 Unique(Distinct)한 수를 PURCHASED_USERS로
    • 전체 Unique 유저 중 ONLINE_SALES 내역이 있는 유저들의 Unique(Distinct)수의 비율을 PUCHASED_RATIO로 반환한다. 
  • FROM ONLINE_SALE as O
        LEFT JOIN USER_INFO as U1
        ON O.user_id = U1.user_id,
        USER_INFO as U2 
    • ONLINE_SALES을 O로 불러오고
    • USER_INFO를 U1으로 불러와서 ONLINE_SALES를 기준으로 LEFT_JOIN핝다. 
    • 조인하는 경우 전체 유저 수 데이터에 누락이 생기므로 USER_INFO를 U2로 다시 불러온다. 
  • WHERE YEAR(U1.joined) = 2021
        AND YEAR(U2.joined) = 2021
    • 2021년에 서비스에 들어온 유저로 한정하기 위해 U1, U2를 2021년 유입인원으로 한정한다. 
  • GROUP BY YEAR, MONTH
    • YEAR과 MONTH를 기준으로 묶어서 보여준다. 
  • ORDER BY YEAR ASC, MONTH ASC;
    • YEAR과 MONTH를 기준으로 오름차순한다. 
반응형