1. 가변 길이 레코드

이전 글에서 설명했던 것 처럼 고정길이 레코드는 블록 내부에서 일정한 크기를 가지는 레코드를 순차적으로 저장하게 된다. 여기서 2가지 문제점이 생긴다.

첫번째 문제점은 블록의 나머지 공간을 버리고 다른 블록을 사용하면 되고 두번째는 블록내부에 header를 하나 놓고 이를 이후에 삭제된 부분을 pointing하면서 삭제 후 삽입을 진행하면된다.

하지만 이 고정 길이 레코드의 한계점이 어느정도 존재한다.

우선 데이터의 종류에 따른 문제가 있다.

결국 변화하는 레코드에 대응 하기 위해 다른 레코드 형식은 가변길이 레코드 기술이 나오게 된다.

가변길이 레코드는 크게 2개의 부분으로 구성된다.

이때 가변 길이는 레코드의 처음 부분에 [오프셋(offset), 길이(length)]를 통해서 데이터를 표현하게 된다. 이러한 형식을 레코드의 앞부분 고정 길이 부분 이후에 이 속성값을 연속적으로 저장한다.

이렇게되면 아래와 같은 구조를 가질 수 있다

레코드 스키마
ID(varchar), name(varchar), dept_name(varchar), salary(Int)
레코드 블록
|21,5|26,10|36,10|65000|0000|10101|Srinivasan|Comp.Sci|

위의 구조를 설명하면 아래와 같다.

여기서 65000값뒤에 0000의 null bitmap이라고 부른다. 만약 name과 salary가 null이 허용되고 실제 값이 null로 없다면 null bitmap은 0101이 될 것이다.

이러한 가변길이 레코드를 저장하는 방식은 일반적인 방식과는 좀 다르게 저장되어야한다. 레코드의 길이가 각기 다르기 때문에 기존 고정길이 레코드와는 다르게 저장되어야하고 이는 블록을 header와 record로 정의한다. 각 헤더에는 다음과 같은 정보가 들어있다.

이러한 구조가 되면 가장 마지막 포인터 부터 가장 첫번째 레코드의 사이는 연속적으로 비어있음을 알 수 있다.

이러한 구조에서 레코드를 삭제하면 어떻게 될까?

🍡codebastardarch