반응형

안녕하세요. 신기한 연구소입니다.

데이터를 조회한 후 결과를 가지고 비율을 정해서 사용하고 싶다면

윈도우함수의 비율함수를 사용하면 됩니다.

 

 

NTILE()

전체 조회된 데이터를 순차적으로 나열한 뒤 원하는 수만큼의 그룹으로 나눌 수 있습니다.

 

 

위 쿼리의 결과를 보겠습니다.

NTILE(3)으로 ARGUMENT를 3을 입력했습니다.

JOB을 GROUP BY 해서 JOB별로 OVER (ORDER BY SUM(SAL) DESC)

즉, SUM(SAL)로 역순 정렬하게 했습니다.

결과는 GD에 순번이 3으로 3개 그룹으로 나누었습니다.

1, 2는 2개 3은 1개입니다.

그룹을 정할 때 딱 나눠지지 않으면 1순위부터 1개씩 더 추가하는 방식으로

그룹이 정해집니다.

총 5개 결과를 3개 그룹으로 묶어야 하니 2개가 남게 됩니다.

그래서 1위에 1개 2위에 1개씩 추가했습니다.

 

 

이번에는 5개씩 나눴습니다. 남는 게 없으니 딱 맞게 하나씩 정해졌네요.

 

 

이번에는 GROUP BY를 사용하지 않고 총 15건 중 7개의 그룹으로 나눴습니다.

15개니 1개가 남아서 1위에 하나 더 추가되었네요.

이렇게 결과에 대해 균등하게 그룹 순번을 표현하고 싶을 때 NTILE()을 사용하면

딱 좋겠네요..

 

RATIO_TO_REPORT()

 

선택한 컬럼의 전체 합을 구한 뒤 해당 컬럼 하나의 값마다 전체 합에 대한 비율을

보여주는 함수입니다.

만약 총 합계가 10000이고 첫 번째 행이 1000이면 0.1이 되겠네요..

 

 

위 쿼리의 결과를 보겠습니다.

먼저 SU를 보면 COMM의 총합을 표현하고 있습니다.

WSUM은 COMM을 총 합인 SU로 나눈 백분율을 소수점으로 나타내고 있습니다.

RTR을 보면 RATIO_TO_REPORT를 사용했는데 같은 결과가 같습니다.

선택된 컬럼의 전체 합에 대해 각 행의 백분율을 소수점으로 표현하는

함수이니 잘 활용하세요.

 

PERCENT_RANK()

 

PARITION BY로 소그룹을 지정한 컬럼을 기준으로 첫 컬럼은 0이고

마지막 컬럼은 1이 됩니다.

그리고 그 사이의 컬럼은 비율대로 소수점으로 표현하게 됩니다.

예를 들어 소그룹에 대한 행이 3건이라면

첫번째 행은 0 두번째 행은 0.5 세 번째 행은 1의 결과를 보여줍니다.

 

 

위 쿼리의 결과를 보겠습니다.

JOB별로 PERCENT_RANK를 구해봤습니다.

JOB을 보면 ANALYST는 1건이라 PR이 0입니다.

CLERK는 3건이라 0/0.5/1이 순서대로 나왔습니다.

SALESMAN의 경우 7건입니다.

첫번째는 0이고 마지막은 1인데 가운데 0.2가 4건, 0.8이 1건 나왔습니다.

중복된 값은 같은 비율을 표현하고 있네요. 참고하세요.

 

CUME_DIST()

 

이 함수는 PERCENT_RANK()와 비슷한 듯 다릅니다.

 

 

JOB을 그룹 조건으로 (PARTITION BY JOB) SAL 역순으로 조회했습니다.

CLERK를 보면 마지막 SAL은 800입니다.

마지막 값을 기준으로 앞으로 백분율을 표시합니다.

즉 800이 1이 되고 비율로 0.67/0.33이 조회되었습니다.

SALESMAN은 중복된 값이 있어서 0.86으로 같은 값이 조회되었네요.

 

 

SAL을 순정렬 했습니다.

이제는 CLERK의 1300 값이 1이 되었습니다.

 

 

JOB에 대한 소그룹이 아닌 전체에 대해 조회해 봤습니다.

이제 이해가 잘 되시나요?

 

지금까지 윈도우함수 중 비율함수에 대해 살펴봤습니다.

잘못된 정보나 수정이 필요하면 댓글 주세요.

아래 하트(공감) 버튼을 눌러서 더 다양한 글을 쓸 수 있게 응원 부탁드립니다. 감사합니다.

 

반응형
반응형

안녕하세요. 신기한 연구소입니다.

윈도우함수를 공부하다 보니 정말 편하게 사용할 수 있는 함수들이 많음을

알게 되었습니다.

개발할 때 필요한 블로그가 되었으면 좋겠네요. ㅎㅎ

 

 

이번 포스팅은 윈도우함수 중 집계함수에 대해 알아봅니다.

 

SUM()

보통 SUM()은 우리가 GROUP BY와 함께 사용하는 함수인데요.

윈도우함수를 사용하면 GROUP BY를 사용하지 않고

다양한 기능을 사용할 수 있답니다.

 

 

기본적으로 사용하는 방법으로 조회했습니다.

SAL 컬럼을 SUM 해서 역순으로 정렬했습니다.

결과는 ROW가 진행되면서 합산한 금액을 확인할 수 있습니다. (S_DEF_SAL)

특이한 점은 8행부터 12행까지 합산 금액이 같은데 이유는 SAL이 같기에 RANGE 처럼

같은 SAL을 전부 합산해서 보여주는 구조입니다.

결국 RANGE를 사용한 S_RAN_SAL과 같은 결과를 보여줍니다.

같은 금액과 관계없이 그냥 하나씩 더하는 결과를 만들 수 있습니다.

바로 ROWS를 사용하면 됩니다. (S_ROW_SAL)

쿼리의 UNBOUNDED PRECEDING은 처음부터 합산하라는 의미입니다. 

 

 

PARTITION BY JOB을 사용해서 JOB별로 묶을 수 있습니다.

기본 S_PAR_ORD_SAL을 보면 JOB별로 합계를 구하는 결과를 확인할 수 있습니다.

같은 SAL 구간인 11행부터 14행의 합산은 묶음 합산되었음을 확인할 수 있습니다.

ROWS/RANGE에 대한 합산도 확인할 수 있습니다.

ROWS는 SAL이 같아도 순차적으로 합산합니다.

마지막으로 S_PAR_ROW_BT_SAL의 결과를 보면

BETWEEN을 사용해서 범위를 정했음을 볼 수 있습니다.

1 PRECEDING AND 1 FOLLOWING의 의미는

현재 행에서 앞의 1행부터 다음 1행 총 3개의 행에 대한 합산을 표시하라는 의미입니다.

 

MAX(), MIN()

MAX() 함수는 최대 값을 구하는 함수이고 MIN() 함수는 최소 값을 구하는 함수입니다.

그래서 OVER 옵션에 ORDER BY를 사용할 필요가 없습니다.

PARTITION BY로 소그룹을 만들어 최고 값을 확인할 때 용이합니다.

 

 

위 쿼리를 확인하면 JOB별로 최고 값과 최소 값을 확인할 수 있습니다.

간단하게 사용하니 좋네요.

 

AVG()

평균값을 구하는 AVG() 함수는 그룹 함수에서 자주 사용합니다.

GROUP BY와 함께 사용해야 하지만 윈도우함수를 사용하면

간단하게 SELECT문에서 사용할 수 있습니다.

PARTITON BY를 이용해서 JOB별 평균을 구할 수 있습니다.

 

또한 BETWEEN을 사용해서 JOB별에서 행의 구간을 정해서 평균을 구할 수

있습니다.

 

 

COUNT()

조건에 맞는 행의 건수를 보여주는 COUNT도 윈도우함수를 사용할 수 있습니다.

 

 

위 쿼리를 확인해 보겠습니다.

CNT1의 경우는 값의 범위를 정할 수 있는 RANGE BETWEEN을 사용했습니다.

현재 선택된 행의 SAL 값을 기준으로 -500보다 작은 값부터 현재 값에서 500만큼

큰 값을 범위로 잡아서 해당 범위에 만족하는 행들의 건수를 보여줍니다.

CNT2는 행의 범위를 정할 수 있는 ROW BETWEEN을 사용했습니다.

그래서 현재 행을 기준으로 앞의 행과 그다음 행의 존재를 확인 후

건수를 보여줍니다.

그런데 행의 건수는 별 의미가 없겠네요. ㅎㅎ

마지막은 PARTITION BY를 사용하는 경우입니다.

JOB 별로 그룹을 만들어 COUNT를 할 수 있습니다.

 

GROUP BY를 사용하지 않고 컬럼 기준으로

원하는 집계를 표현할 수 있게 되었습니다.

 

잘못된 정보나 수정이 필요하면 댓글 주세요.

아래 하트(공감) 버튼을 눌러서 더 다양한 글을 쓸 수 있게 응원 부탁드립니다. 감사합니다.

 

 

반응형