오라클, SQL, 자바, 스프링프레임워크, 닷넷, C#, WPF 강좌: [오라클학원,자바학원]오라클 SQL 기초 강좌 : 오라클 인덱스(ORACLE INDEX) 소개인덱스 개념 및 비트리 인덱스(B*Tree Index) 소개

2021년 11월 28일 일요일

[오라클학원,자바학원]오라클 SQL 기초 강좌 : 오라클 인덱스(ORACLE INDEX) 소개인덱스 개념 및 비트리 인덱스(B*Tree Index) 소개

http://ojc.asia/bbs/board.php?bo_table=LecOracle&wr_id=293

오라클동영상, 오라클 인덱스(ORACLE INDEX) 소개 인덱스 개념 및 비트리 인덱스(B*Tree Index) 소개

오라클 SQL 기초 강좌 : 오라클 인덱스(ORACLE INDEX) 소개인덱스 개념 및 비트리 인덱스(B*Tree Index) 소개인덱스 소개인덱스는 테이블의 칼럼에 대해 생성되는 객체로 별도의 공간에 컬럼값들을 정렬

ojc.asia

https://youtu.be/HAN5QruWjxU

https://youtu.be/agFbSyrV22A

인덱스 소개

인덱스는 테이블의 칼럼에 대해 생성되는 객체로 별도의 공간에 컬럼값들을 정렬한 후 생성 합니다. 데이터 검색 속도를 향상 시키기 위해 사용되며, 포인터를 이용하여 데이터를 랜덤 액세스random access 합니다.

예를들어 수천억건 이상의 고객데이터가 있고 고객이름으로 인덱스가 생성되어 있지 않다고 했을 때 “홍길동” 고객을 검색하려면 처음 행부터 “홍길동” 고객이 출현할 때 까지 검색을 해가야 합니다. 운이 없어서 마지막 행에 “홍길동” 데이터가 있었다면 검색속도는 아주 느려질 것 입니다. 그러나 고객이름으로 가나다 순으로 인덱스가 생성되어져 있다면 랜덤 액세스로 바로 찾아 갈 수 있습니다. 이 두경우는 하늘과 땅 차이죠^^ 그만큼 인덱스는 중요하답니다.

오라클에서 인덱스를 통해 데이터를 검색하는 이유는 조건을 만족하는 데이터를 빨리 찾고 거기서 ROWID(오라클에서 실제 레코드, 행이 있는 물리적 주소)를 찾은 후 실제 원본 데이터를 빠르게 접근하기 위해서 입니다.

우리가 흔히 오라클에서 흔히 만드는 인덱스는 비트리(B*Tree) 인덱스인데요,

B*Tree 인덱스는 오라클의 대표적인 형태의 인덱스로 오라클에서 CREATE INDEX로 별다른 옵션없이 생성되면 전부 B*Tree 인덱스 입니다. 인덱스 구조가 자료구조에서 배운 TREE와 비슷해서 균형잡힌 트리 B*TREE(Balanced Tree)라고 합니다.

다음은 EMP 테이블에서 사원이름 컬럼을 내림차순(Z -> A 순서)으로 정렬했을 때의 B*Tree 인덱스의 내부 구조 입니다. (SELECT * FROM EMP WHERE ENAME = ‘JAMES’)

[그림 13.1 B*Tree 인덱스 내부구조]

B*Tree 인덱스의 리프 블록leaf blocks에는 실제 인덱스 데이터와 원본 테이블 행의 ROWID가 있는데 각 항목은 인덱스 데이터 + ROWID로 정렬되어 있고, 브랜치 블록branch blocks은 리프 블록을 찾아가기 위한 인덱스 데이터를 가지고 있습니다. 모든 리프 블록이 동일한 깊이에 있기 때문에 B-Tree 인덱스는 균형을 이루고 각각의 행들을 검색하는데는 거의 동일한 시간이 소요됩니다.

리프 블록의 ROWID는 인덱스 경유 후 원본 테이블의 데이터에 접근해서 값을 읽어야 하는 경우 이용되며, ROWID에는 object #, file #, block # 및 row #이 포함됩니다. 여기서 file #은 물리적 데이터베이스 파일, block #은 데이터가있는 블록, row #은 블록 내의 테이블 행에 대한 포인터입니다.

리프 블록은 적절한 다음 및 이전 리프 블록을 가리 킵니다. 이렇게하면 리프 블록 자체가 디스크 전체에 저장 되더라도 인덱스에 논리적 순서가 부여되고 이를 통해 범위 스캔, 내림/오름차순 검색 등을 수행 할 수 있습니다.

테이블의 기본키primary key와 같이 고유 인덱스unique indexes로 생성되면 데이터 값당 하나의 ROWID를 가지고 있고 값이 유일하므로 값에 따라서 정렬됩니다. 하지만 이름처럼 중복될가능성이 있는 경우(고유 인덱스가 아닌 경우)에는 ROWID가 정렬 된 순서로 키에 포함되므로 인덱스 키값 즉 이름 및 ROWID를 기준으로 정렬됩니다. 사원테이블에서 이름이 동일한 사원이 있을 경우 ROWID를 기준으로 정렬됩니다.

만약 이름(ename) 컬럼에 NULL인 데이터가 있다면 ename 오름차순 정렬시 맨 뒤에 위치하며 NULL값은 인덱스에 포함되지 않습니다. 그래서 WHERE ename IS NULL을 사용하면 ename 인덱스를 경유하지 않으니 주의해야 합니다.

만약 여러개의 컬럼으로 B*Tree 인덱스를 구성한다면 첫번째 열, 선행 컬럼은 가장 자주 액세스 되며 유일한 값을 가지는 컬럼을 사용하는 것이 좋습니다.

생성된 B*Tree 인덱스는 오라클에서 자동으로 유지 관리하는데 인덱싱 된 테이블에 값을 삽입/수정 할 때 약간의 오버헤드가 있습니다. 입력 또는 수정이 빈번한 테이블에 많은 인덱스가 있는 경우 문제가 될 수 있으니 주의해야 합니다.

또한 B*Tree 인덱스는 실제 컬럼 값을 인덱스 영역에 정렬해서 보관 하므로 데이터의 중복이 생기고 칼럼 값의 선택도/분포도(전체 데이터중 5~10% 정도 선택, 값이 다양하고 유일할 수 수록)가 좋아야 최적의 성능을 내는 구조 입니다. OR 처럼 범위를 넓히면서 검색하는 경우 인덱스를 사용하지만 제 성능을 내기 어려우며 특히 NOT을 사용하는 부정연산에는 취약 합니다.

인덱스는 한번 생성되면 오라클에 의해 내부적으로 자동 관리되며 인덱스를 생성해야 하는 컬럼은 SQL문의 WHERE절 or 조인절에 빈번히 출현되는 칼럼 입니다.

아래는 테이블 원본 데이터와 인덱스와의 구조를 표현 했습니다.

[그림 12.1 인덱스구조]

사원(EMP) 테이블의 사원명(ename) 컬럼에 인덱스가 생성되어 있는 모습 입니다. USER라는 테이블스페이스에 EMP 테이블 데이터 원본이 존재하고, 인덱스는 별도의 이름을 가진 다른 테이블스페이스에 생성이 되어 있습니다. 그림의 맨 좌측 16진수 문자열 컬럼은 ROWID 컬럼으로 모든 행들의 물리적인 주소를 가리키는 의사컬럼이 입니다.

EMP 테이블에서 “CLARK” 사원의 직무 JOB을 조회 합니다.

“CLARK” 사원의 직무(JOB) 컬럼을 조회한다면 SQL은 SELECT job FROM EMP WHERE ENAME = ‘CLARK’ 이러한 형태가 되고 인덱스를 경우하여 데이터를 조회한다고 가정을 했을 때 인덱스를 경유한다면 오라클은 원본 테이블 데이터가 있는 USERS 테이블스페이스table spaces의 EMP 테이블에 접근하는 것이 아니라 그림의 오른쪽 인덱스 영역에서 CLARK을 랜덤 액세스하여 찾고 그 ROWID 값을 이용하여 다시 원본테이블에 와서 JOB 컬럼값을 추출 하는 것 입니다.

인덱스를 생성하는 기본형식은 아래와 같습니다.

[기본형식]

CREATE [UNIQUE] INDEX index_name
ON table_name (Column|Expr[,Column|Expr]...);

인덱스 종류

인덱스를 만드는형태에 따라 하나의 컬럼으로 인덱스를 만드는 단일인덱스, 여러개의 컬럼으로 인덱스를 만드는 복합 인덱스, 오름차순 또는 내림차순 인덱스, SQL함수나 표현식에 생성하는 함수기반 인덱스로 구분할 수 있습니다.

실제 인덱스가 내부적으로 어떻게 구성되어 지는지에 따라서 일반적인 오라클 인덱스인 균형잡힌 트리 형태의 B*Tree 인덱스, 비트를 이용하여 컬럼 값을 간결하게 저장하는 Bitmap 인덱스, 두 테이블 조인시 조인한 결과 칼럼에 대해 비트맵 인덱스를 생성하는 Bitmap Join 인덱스, 인덱스 컬럼의 값을 역으로 변경하여 B*Tree 인덱스를 구성한 역전환키 인덱스reverse key indexes 등이 있습니다.

인덱스가 꼭 필요한 이유

인덱스는 테이블 데이터에 액세스access 할 때마다 모든 행을 검색하지 않고도 데이터를 빠르게 찾는 데 사용됩니다. 기업에서 데이터베이스를 많은 자금을 들여 도입하는 이유중 하나는 빠른 검색 속도 입니다. 테이블에 데이터가 100건 있으나 수천억건 있으나 조회 속도는 비슷해야 한다는 이야기 입니다.

실무 현장에서 개발할 때 개발환경의 테이블에는 몇개의 행이 없지만 실 운영 상태가 되어 데이터 이행등을 한 후에는 어마어마한 데이터가 있을 수도 있다는 사실을 명심하고

사소한 SQL문을 작성할 때도 항성 검색 성능에 신경을 쓰고 개발을 해야 합니다.

#오라클학원, #오라클교육, #오라클동영상, #ORACLE학원, #ORACLE교육, #ORACLE동영상, #ORACLE인덱스,#오라클인덱스, #ORACLE, #오라클, #비트리인덱스, #인덱스란, #CREATEINDEX, #인덱스생성

오라클학원, 오라클교육, 오라클동영상, ORACLE학원, ORACLE교육, ORACLE동영상, ORACLE인덱스,오라클인덱스, ORACLE, 오라클, 비트리인덱스, 인덱스란, CREATEINDEX, 인덱스생성

2021년 11월 28일 일요일

[오라클학원,자바학원]오라클 SQL 기초 강좌 : 오라클 인덱스(ORACLE INDEX) 소개인덱스 개념 및 비트리 인덱스(B*Tree Index) 소개

인덱스 소개

인덱스 종류

인덱스가 꼭 필요한 이유

댓글 없음:

댓글 쓰기

(C#교육동영상)C# ADO.NET 실습 ODP.NET/ODAC 설치 오라클 함수 호출 실습, C#학원, WPF학원, 닷넷학원, 자바학원

신고하기

태그