Search

반응형

안녕하세요. 신기한 연구소입니다.

개발을 하다 보면 계층형 쿼리를 만나게 됩니다.

 

 

사실 계층형 쿼리를 제대로 배워서 사용하는 개발자도 있겠지만

그냥 다른 개발자가 만든 것을 복사해서 대충 쓰거나

잘 이해도 못하고 사용하는 경우도 있습니다.

필자도 사실 처음 그랬던 기억이 있습니다. ㅎㅎ

 

 

개발하다 가끔 만나는 쿼리인데 본 적 있나요?

이제 제대로 이해하고 사용해 봅시다~~

 

START WITH절은 루트노드(행)을 명시합니다.

무슨 의미일까요?

EMP 테이블을 확인해 보면 해당 사원의 관리자가 있습니다.

그 관리자가 최종 관리자일수도 있지만

그 관리자도 더 상위 관리자가 있을 수 있습니다.

하지만 결국 마지막 최종 관리자가 있을 것이고

그 최종 관리자는 더 이상 자신의 관리자는 없기에

관리자 컬럼은 NULL일겁니다.

 

 

START WITH

그래서 시작을 최종(최고)관리자부터 해야 하기에

START WITH에서 관리자 컬럼이 NULL인 부분을 조건식으로 넣게 됩니다.

EMP에서 관리자 컬럼 MGR을 보면 ENAME = ‘KING’이 NULL로 되어 있습니다.

최종 관리자라는 의미네요.

 

CONNECT BY

CONNECT BY는 연결 고리를 가지고 목록을 가져옵니다.

먼저 START WITH에서 조건에 맞는 최상위 행을 가져옵니다.

이제 최상위 행 하나를 갖게 되었습니다.

다음으로 최상위 행을 관리자로 갖는 다음 계층 데이터를 가져와야 합니다.

그럼 현재 찾아 온 최상위 관리자의 EMPID를 추출해서 다음 행들을 구해야 합니다.

그 최상위 EMPID를 MGR로 갖는 행들을 찾아야합니다.

CONNECT BY PRIOR EMPID = MGR

연결하는 방식은 미리 구한 앞 행의 EMPID와 구해야 할 MGR이 같은 행들을 구합니다.

그럼 이제 START WITH에서 구한 최상위 행과

그 행의 EMPID를 MGR로 갖는 행들을 갖게 되었습니다.

이제 다음 작업은 최상위 행으로 구한 두번째 계층의 행들을 가지고

그 계층들의 EMPID를 MGR로 갖는 다음 계층의 행들을 구합니다.

그렇게 쭉~ 끝까지 구하면 됩니다.

CONNECT BY PRIOR EMPID = MGR

이 표현식이 이해 되셨나요?

연결 방식은 바로 전에(PRIOR) 구한 계층의 EMPID를 MGR로 갖는 데이터를 구한다.

그렇게 이해하면 되겠습니다.

 

만약 PRIOR을 반대로 설정하면 어떻게 될까요?

CONNECT BY EMPID = PRIOR MGR

연결 방식은 바로 전에(PRIOR) 구한 계층의 MGR을 EMPID로 갖는 데이터를 구한다.

START WITH로 먼저 최상위 행을 구했는데..

그 다음 구할 계층이 최상위 행의 MGR (최상위니 NULL이죠?) 을 EMPID로 갖는 값은

없겠네요..NULL이니까요.

 

이해가 되셨나요?

 

이제 계층형 쿼리를 만들 수 있게 되었으니 더 다양한 기능을 살펴보겠습니다.

 

 

LEVEL

계층형 쿼리를 조회하면 현재 행이 계층의 몇번째 레벨인지 표시해 줍니다.

계층형 쿼리에서만 사용하는 모조 컬럼입니다. 실제 테이블에 있는 컬럼은 아니지만

SELECT 문에서 사용할 수 있는 컬럼입니다.

최상층 레벨을 1로 해서 쭉~ 2, 3, 4로 나옵니다.

 

 

이 LEVEL을 가지고 여백을 주거나 다른 용도로 활용할 수 있습니다.

 

CONNECT_BY_ROOT

현재 조회된 행들의 최상위 정보를 보여줍니다. 역시 모조 컬럼입니다.

CONNECT_BY_ROOT(ENAME), CONNECT_BY_ROOT ENAME

 

이렇게 두가지 방식으로 사용할 수 있습니다.

 

CONNECT_BY_ISLEAF

현재 행이 마지막 계층의 데이터인지 확인하는 기능입니다.

모조 컬럼입니다.

즉 LEAF를 만나면 1을 반환하고 아니면 0을 반환합니다.

 

 

 

CONNECT_BY_ISCYCLE

현재 행의 조상이기도 한 자식을 갖는 경우 1을 반환합니다.

이 모조 컬럼을 사용하기 위해서는

CONNECT BY 다음에 NOCYCLE를 사용해야 합니다.아래 쿼리를 확인해봅니다.

 

 

 

상위 계층의 부모가 자식이 되는 크로스 상황이 되어 있습니다.

이런 경우 부모가 잘못 설정된 부분을 찾기 위해 사용하면 되겠네요.

 

SYS_CONNECT_BY_PATH( 컬럼, 구분자)

 

루트 노드부터 해당 행까지의 경로를 입력한 컬럼 기준으로

구분자를 사용해서 보여줍니다.

 

 

지금까지 계층형 쿼리를 알아봤습니다.

 

(추가)

하나 더 빠진 부분인데요.

ORDER SIBLINGS BY에 대해 알아볼께요.

 

 

ORDER BY 없이 조회한 결과 입니다.

레벨 2 이후 정렬이 안된 모습을 볼 수 있습니다.

 

 

그래서 ORDER BY ENAME 을 추가했습니다.

그런데 결과가 우리가 원하는 계층별로 정렬되는 것이 아닌 

레벨과 전혀 관계없이 그냥 순차적으로 정렬이 되서 계층이 망가졌습니다.

 

 

ORDER SIBLINGS BY ENAME을 사용했습니다.

레벨 단위로 정렬이 잘 되었습니다.이제 SIBLINGS를 사용해서 깔끔한 계층형 쿼리를 만들 수 있습니다.

 

 

이제는 편하게 이용할 수 있겠네요.

잘못된 내용이나 수정이 필요하면 댓글 주세요.

아래 하트(공감) 버튼을 눌러서 더 다양한 글을 쓸 수 있게 응원 부탁드립니다. 감사합니다.

반응형
반응형

안녕하세요. 신기한 연구소입니다.

쿼리를 만들다 보면 다양한 join을 만나게 되는데요.

사실 기본 INNER JOIN과 OUTER JOIN을 많이 사용합니다.

그 외에도 NATURAL JOIN과 CROSS JOIN이 있는데..

어떤 의미이며 어떻게 사용하는지 그 방법에 대해 알아봅니다.

 

 

조인에 대해 명시를 하는 INNER, OUTER, NATURAL, CROSS 등을 표준 조인

또는 ANSI 조인이라고 합니다.

그럼 NATURAL JOIN에 대해 살펴봅니다.

이 조인의 특징은 바로 두 테이블 간 공통된 컬럼을 자동으로 인식하는 겁니다.

그 말은 연결 고리를 표시할 필요가 없다는 의미입니다.

 

 

위 쿼리를 보면 NATURAL INNER JOIN 과 NATURAL JOIN 두 가지로 사용되었는데

같은 의미입니다.

INNER는 생략이 가능합니다.

그러고 보니 저번에 INNER JOIN을 포스팅했었는데요.

INNER JOIN은 EQUI(등가) 조인으로 양 쪽 테이블에 같은 값을 가지는 컬럼을 묶어서

연결하는 구조였습니다.

NATURAL JOIN도 INNER JOIN이라면 같은 의미겠지요?

다른 점은 연결 컬럼인 DEPTNO를 명시적으로 표현하지 않았고 알아서 자동으로 연결된다는

점입니다.

그래서 ON, USING, WHERE절의 조인 방식을 사용할 수 없습니다.

또한 연결한 두 테이블의 컬럼은 같은 이름, 같은 데이터 유형이어야 합니다.

또한 별칭(ALIAS)을 사용할 수도 없어요.

또 다른 점은 결과 조회인데요.

INNER JOIN은 *로 조회하면 두 개의 테이블에 존재하는 같은 컬럼이 각각 표시됩니다.

NATURAL JOIN은 한 개만 조회됩니다.

INNER JOIN은 *로 조회하면 두 개의 테이블 전체 컬럼을 순서대로 출력합니다.

NATURAL JOIN은 한 개만 조회된다고 했는데 제일 앞 컬럼에 나옵니다.

그럼 어떤 컬럼으로 조인되었는지 확인이 가능하겠네요.

 

 

위 쿼리와 이번 쿼리와 결과를 비교해 보세요. 이해하기 쉬울 겁니다.

 

다음은 CORSS JOIN 또는 CARTESIAN PRODUCT에 대해 알아봅니다.

사실 조인이라 해야 할지 모르겠네요.

이유는 조인인데 조인 조건이 없습니다.

그냥 두 개 테이블을 M*N으로 곱해서 조회하는 구조거든요.

A 테이블이 10건, B 테이블이 5건이면 10*5 = 50건의 조합으로 데이터가 조회됩니다.

 

 

 

먼저 두 테이블의 각각 건수를 확인합니다.

12건과 5건이 나오네요.

 

이제 CROSS JOIN을 시도합니다.

ANSI 가 아닌 일반적으로 사용할 때는 두 테이블을 FROM절에 콤마(,)로 나열하고

조인 조건을 설정하지 않으면 됩니다.

ANSI로 작성하는 경우는 CROSS JOIN을 사용하고 ON과 USING을 사용하지 않아야 한다.

 

 

이렇게 쿼리를 작성하고 조회하면

12*5 = 60건의 결과가 조회됩니다.

 

중간생략~~

 

사실 일반적인 상황에서 이렇게 조회하지는 않습니다.

그냥 참고로 알고 있으면 되고 대용량 테이블에서 연습 삼아 돌리면 아마 멈출 겁니다. ㅎㅎ

 

잘못된 내용이나 수정이 필요하면 댓글 주세요.

아래 하트(공감) 버튼을 눌러서 더 다양한 글을 쓸 수 있게 응원 부탁드립니다. 감사합니다.

반응형