본문 바로가기

DB

[DB] 트랜잭션 회복 기법

트랜잭션

  • 작업 하나를 수행하는 데 필요한 데이터베이스의 연산들을 모아놓은 것으로, 데이터베이스에서 논리적인 작업의 단위가 된다.
  • 데이터베이스에 장애가 발생했을 때 데이터를 복구하는 작업의 단위도 된다.

 

트랜잭션의 상태

  • 활동 상태: 트랜잭션이 수행되기 시작한 상태
  • 부분 완료 상태: 활동 상태의 트랜잭션이 마지막 연산을 처리한 상태
  • 완료 상태: 부분 완료 상태의 트랜잭션이 commit 연산을 실행한 상태
  • 실패 상태: 활동 상태나 부분 완료 상태에서 여러 원인으로 인해 더는 정상적인 수행이 불가능한 트랜잭션 상태
  • 철회 상태: 실패 상태의 트랜잭션은 롤백 연산의 실행으로 철회 상태가 된다.
  • 트랜잭션이 완료 상태이거나 철회 상태가 되면 트랜잭션이 종료된 것으로 판단

 

활동 상태

  • 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태
  • 활동 상태인 트랜잭션은 상황에 따라 부분 완료 상태나 실패 상태가 된다.

부분 완료 상태

  • 트랜잭션의 마지막 연산이 실행된 직후의 상태
  • 트랜잭션의 모든 연산을 처리한 상태이다.
  • 부분 완료 상태의 트랜잭션은 상황에 따라 완료 상태나 실패 상태가 될 수 있다.

완료 상태

  • 트랜잭션이 성공적으로 완료되어 커밋 연산을 실행한 상태
  • 트랜잭션이 완료 상태가 되면 트랜잭션이 수행한 최종 결과를 데이터베이스에 반영

실패 상태

  • 하드웨어나 소프트웨어의 문제, 트랜잭션 내부의 오류 등 여러 이유로 인해 장애가 발생하여 트랜잭션의 수행이 중단된 상태
  • 트랜잭션을 더는 정상적으로 수행할 수 없을 때 실패 상태가 된다.

철회 상태

  • 트랜잭션을 수행하는 데 실패하면 롤백 연산을 실행한 상태
  • 철회 상태가 되면 트랜잭션이 수행되기 전의 데이터베이스 상태로 되돌리면서 트랜잭션이 종료된다.
  • 철회 상태로 종료된 트랜잭션은 상황에 따라 다시 수행되거나 폐기 된다.
  • 트랜잭션 내부의 문제 → 철회된 트랜잭션을 폐기
  • 하드웨어의 이상이나 소프트웨어의 오류 → 철회된 트랜잭션을 다시 시작

장애

장애의 유형

트랜잭션의 특성을 보장하고, 데이터베이스를 모순이 없는 일관된 상태로 유지하기 위해 데이터베이스 관리 시스템은 회복 기능을 제공한다. 장애가 발생하는 원인은 사용자의 실수, 정전 등으로 인한 하드웨어 고장, 소프트웨어의 논리적인 오류 등 매우 다양하다.

유형 의미 원인
트랜잭션 장애 트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태 트랜잭션의 논리적 오류, 잘못된 데이터 입력,
시스템 자원의 과다 사용 요구, 처리 대상 데이터의 부재 등
시스템 장애 하드웨어의 결함으로 정상적으로
수행을 계속할 수 없는 상태
하드웨어 이상으로 메인메모리에 저장된 정보가 손실되거나
교착 상태가 발생한 경우 등
미디어 장애 디스크 장치의 결함으로 디스크에 저장된
데이터베이스의 일부 혹은 전체가 손상된 상태
디스크 헤드의 손상이나 고장 등

 

 

데이터베이스의 저장 장치 종류

저장 장치 의미
휘발성 저장 장치 장애가 발생하면 저장된 데이터가 손실됨 메인 메모리 등
비휘발성 저장 장치 장애가 발생해도 저장된 데이터가 손실되지 않음.
단, 디스크 헤더 손상 같은 저장 장치 자체에 이상이 발생하면 데이터가 손실될 수 있음.
디스크, 자기 테이프, CD/DVD 등
안전 저장 장치 비휘발성 저장 장치를 이용해 데이터 복사본 여러 개를 만드는 방법으로, 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음.  
  • 데이터베이스는 기본적으로 저장 장치에 저장된다.
  • 그리고 저장 장치는 장애가 발생했을 때 대응하는 방법에 따라 세 종류로 분류할 수 있다.

 

데이터베이스의 저장 연산

일반적으로 데이터베이스는 비휘발성 저장 장치인 디스크에 상주함.하지만 트랜잭션이 데이터베이스의 데이터를 처리할려면 

데이터를 디스크에서 메인 메모리로 가져와 이를 처리한 후 그 결과를 다시 디스크로 보내는 작업이 필요하다.

 

 

디스크와 메인 메모리 간의 데이터 이동

연산 종류 의미
input(X) 디스크 블록에 저장되어 있는 데이터 X를 메인 메모리 버퍼 블록으로 이동시키는 연산
output(X) 메인 메모리 버퍼 블록에 있는 데이터 X를 디스크 블록으로 이동시키는 연산
  • 디스크와 메인 메모리 간의 데이터 이동은 대개 블록 단위로 수행된다.
  • 디스크에 있는 블록을 디스크 블록이라 한다.
  • 메인 메모리에 있는 블록은 버퍼 블록이라 한다.
  • 디스크와 메인 메모리 간의 데이터 이동은 두 연산으로 수행한다.

메인 메모리의 버퍼 블록과 프로그램 변수 간의 데이터 이동 연산

연산 종류 의미
read(X) 메인 메모리 버퍼 블록에 저장되어 있는 데이터 X를 프로그램의 변수로 읽어오는 연산
write(X) 프로그램의 변수 값을 메인 메모리 버퍼 블록에 있는 데이터 X에 기록하는 연산
  • read(X) 연산이 정상적으로 실행되려면 먼저 input(X) 연산의 실행이 요구된다.
  • read(X) 연산이 실행되어 데이터가 프로그램 변수에 저장되고 해당 데이터에 대한 모든 연산은 프로그램 변수를 대상으로 처리된다.
  • 트랜잭션이 성공적으로 완료 되려면 트랜잭션의 모든 연산을 처리한 후 결과 값을 디스크의 데이터베이스에 반영해야 한다.
  • 이를 위해 write(X) 연산이 실행된 후 output(X) 연산이 실행된다.

회복 기법

회복은 데이터베이스에 장애가 발생했을 때 장애가 발생하기 전의 모순이 없고 일관된 상태로 복구하는 것

데이터베이스 관리 시스템에 있는 회복 관리자가 담당한다.

대개 장애가 일어난 데이터베이스를 복구하는 동안에는 데이터베이스에 접근하여 업무를 처리할 수 없다.

그러므로 데이터베이스를 회복시키는 작업은 빠른 시간 내에 이루어져야 한다.

 

 

회복을 위해 복사본을 만드는 방법

 

데이터베이스 회복의 핵심 원리는 데이터 중복이다.

데이터를 별도의 장소에 미리 복사해두고, 장애가 발생했을 때 복사본을 이용해 원래의 상태로 복원한다.

덤프 또는 로그 방법을 사용해 데이터를 복사해두었다가 회복시킬 때 복사본을 사용한다.

연산 종류 의미
덤프(dump) 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법
로그(log) 데이터베이스에서 변경 연산이 실행될 때마다
데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법
  • 데이터베이스 전체를 복사하는 덤프 방법은 미리 정해진 주기에 따라 수행한다.
  • 그리고 디스크와 같은 비휘발성 저장 장치에 데이터베이스 복사본을 저장한다.

 

회복 연산

연산 종류 의미
redo(재실행) 가장 최근에 저장한 데이터베이스 복사본을 가졍온 후 로그를 이용해 복사본이 만들어진 이후에
실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 데이터베이스 상태로 복구
undo(취소) 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데이터베이스를 원래의 상태로 복구
  • 덤프나 로그 방법으로 중복 저장한 데이터를 이용해 데이터베이스를 복구하는 방법은 redo나 undo 연산을 실행하는 것
  • redo 연산은 로그에 기록된 변경 연산 후의 값을 이용하여 변경 연산을 재실행하는 방법
  • undo 연산은 로그에 기록된 변경 연산 이전의 값을 이용하여 변경 연산을 취소하는 방법
  • 이처럼 redo와 undo 연산을 실행하는 데는 로그가 중요하게 사용된다.

 

데이터베이스 관리 시스템이 로그를 기록하는 방법

로그 레코드 의미 
<Ti, start> 트랜잭션 Ti가 수행을 시작했음을 기록
<Ti, X, old_value, new_value> 트랜잭션 Ti가 데이터 X를 이전 값에서 새로운 값으로 변경하는 연산을 실행했음을 기록
<Ti, commit> 트랜잭션 Ti가 성공적으로 완료되었음을 기록
<Ti, abort> 트랜잭션 Ti가 철회되었음을 기록
  • 로그는 데이터베이스에 대한 변경 연산과 관련하여, 데이터를 변경하기 이전의 값과 변경한 이후의 값을 기록한 것이다.
  • 로그를 저장한 파일을 로그 파일이라 하고, 로그 파일은 레코드 단위로 기록된다.
  • 일반적으로 로그 파일을 구성하는 레코드는 네 종류로 분류한다.
  • 데이터베이스에 대한 변경 연산은 트랜잭션 단위로 실행되므로 로그 레코드도 트랜잭션의 수행과 함께 기록된다.
  • 로그는 데이터베이스 회복 작업을 수행하기 위해 중요한 정보를 가지고 있으므로 데이터 손실이 발생하지 않는 저장 장치에 저장한다.

로그 회복 기법

로그를 이용한 회복 기법은 데이터를 변경한 연산 결과를 데이터베이스에 반영하는 시점에 따라 두 기법으로 나뉜다.

 

 

데이터베이스 회복 기법 분류

 

 

즉시 갱신 회복 기법

 

즉시 갱신 회복 기법은 트랜잭션 수행 중에 데이터를 변경한 연산의 결과를 데이터베이스에 즉시 반영한다. 그리고 데이터 변경에 대한 내용을 로그 파일에도 기록한다. 데이터베이스 회복 시 로그를 정상적으로 사용하려면, 트랜잭션에서 데이터 변경 연산이 실행되었을 때 로그 파일에 로그 레코드를 먼저 기록한 후 데이터베이스에 변경 연산을 반영해야 한다.

 

즉시 갱신 회복 기법은 장애가 발생하면 로그 파일에 기록된 내용을 참조하여, 장애 발생 시점에 따라 redo나 undo 연산을 실행하여 데이터베이스를 복구한다. 트랜잭션에 redo 연산을 실행할 것인지 undo 연산을 실행할 것인지는 위의 기준에 따라 결정한다.

redo와 undo 연산이 모두 필요할 때는 undo 연산을 먼저 실행한 후 redo 연산을 실행한다.

 

 

지연 갱신 회복 기법

 

지연 갱신 회복 기법은 트랜잭션이 수행되는 동안에는 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영하지 않고

로그 파일에만 기록해두었다가, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터베이스에 한 번에 반영한다.

트랜잭션이 수행하는 동안 장애가 발생할 경우 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지하게 된다. 그래서 지연 갱신 회복 기법에서는 redo 연산만 필요하므로 로그 레코드에 변경 이전 값을 기록할 필요가 없다.

그러므로 변경 연산 실행에 대한 로그 레코드는 <Ti, X, new_value> 형식으로 기록된다.

장애가 발생했을 때 지연 갱신 회복이 취하는 조치는 위의 기준에 따라 결정한다.

 

 

검사 회복 기법

 

로그를 이용한 회복 기법은 로그 전체를 분석하여 로그에 기록된 모든 트랜잭션을 대상으로 redo나 undo 중에서 적용할 회복 연산을 결정해야 하지만 로그 전체를 대상으로 회복 기법을 적용하면 너무 비효율적이다. 이러한 비효율성을 해결하기 위해 제안된 방법이 검사 시점 회복 기법이다.

 

검사 회복 기법은 로그 회복 기법과 같은 방법으로 로그 기록을 이용하되, 일정 시간 간격으로 검사 지점을 만들어둔다.

그리고 장애가 발생하면 가장 최근 검사 시점 이전의 트랜잭션에는 회복 작업을 수행하지 않고, 이후의 트랜잭션에만 회복 작업을 수행한다. 회복 작업의 범위가 검사 시점으로 정해지므로 불필요한 회복 작업을 수행하지 않아 회복 시간이 단축된다는 장점이 있다.

 

일정 시간 간격으로 검사 시점이 되면 메인 메모리에 있는 모든 로그 레코드를 안정 저장 장치에 있는 로그 파일에 기록하고, 트랜잭션의 데이터 변경 내용을 데이터베이스에 반영한다. 검사 시점을 표시하는 <checkpoint L> 형식의 로그 레코드를 로그 파일에 기록한다. <checkpoint L> 형식에서 L은 현재 실행되고 있는 트랜잭션의 리스트를 의미한다.

 

장애가 발생하면 로그 파일에서 가장 최근의 <checkpoint L> 로그 레코드를 찾아 그 이후의 로그 기록에만 회복 작업을 수행한다.

<checkpoint L> 로그 레코드를 이용해 회복 작업의 범위를 결정하는 것이다. 회복 작업의 범위가 정해지면 즉시 회복 기법이나 지연 갱신 회복 기법을 이용해 회복 작업을 수행한다.

 

 

미디어 회복 기법

 

데이터베이스는 비휘발성 저장 장치인 디스크에 저장된다. 디스크의 장애는 드물게 발생하지만 디스크 헤더의 고장 등으로 장애가 발생할 수 있다. 디스크에 발생할 수 있는 장애에 대비한 회복 기법은 미디어 회복 기법이다.

 

미디어 회복 기법은 전체 데이터베이스의 내용을 일정 주기마다 다른 안전한 저장 장치에 복사해두는 덤프를 사용한다.

디스크 장애가 발생하면 가장 최근에 복사해둔 덤프를 이용해 장애 발생 이전의 일관된 데이터베이스 상태로 복구한다.

그런 다음 필요에 따라 로그의 내용을 토대로 redo 연산을 실행한다.

 

전체 데이터베이스를 다른 저장 장치에 복사하는 것은 비용이 많이 들고 복사하는 동안에 트랜잭션 수행을 중단해야 하므로

미디어 회복 기법은 CPU가 낭비된다는 단점이 있다.


 

 

 

 

 

 

'DB' 카테고리의 다른 글

[CS] 데드락  (0) 2024.11.28
[DB] 병행 수행과 병행 제어  (0) 2024.11.25
[DB] Soft Delete VS Hard Delete  (0) 2024.11.24
[DB] 트랜잭션 ACID  (0) 2024.11.23
[DB] 데이터베이스 설계  (0) 2024.11.17