트랜잭션(Transaction)
트랜잭션은 데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위를 뜻한다.
데이터베이스에 접근하는 방법은 쿼리이므로, 여러 개의 쿼리들을 하나로 묶는 단위를 트랜잭션이라 말한다.
ACID
데이터베이스의 일관성을 유지하기 위해 트랜잭션 전후에 특정 속성을 따르게 되는데 이를 ACID 속성이라고 한다.
ACID 속성의 장점
1. 데이터 일관성: 트랜잭션 실행 후에도 데이터가 일관되고 정확하게 유지되도록 보장한다.
2. 데이터 무결성: 데이터베이스에 대한 모든 변경 사항이 영구적이고 손실되지 않도록 하여 데이터 무결성을 유지한다.
3. 동시성 제어: 트랜잭션 간의 간섭을 방지하여 동시에 발생하는 여러 트랜잭션을 관리하는 데 도움이 된다.
4. 복구: 오류나 충돌이 발생한 경우 시스템이 오류나 충돌 지점까지 데이터를 복구할 수 있도록 보장한다.
ACID 속성의 단점
1. 성능: 데이터 일관성과 무결성을 보장하기 위해 추가 처리가 필요하므로 시스템에 성능 오버헤드를 일으킬 수 있다.
2. 확장성: 여러 트랜잭션이 동시에 발생하는 대규모 분산 시스템에서 확장성 문제를 일으킬 수 있다.
3. 복잡성: 시스템의 복잡성이 증가하여 상당한 전문 지식과 리소스가 필요할 수 있다.
ACID 속성의 여러 가지 장/단점을 고려하여 시스템의 요구 사항에 맞게 사용하는 것이 중요하다.
원자성(Atomicity)
트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징이다. 즉, 트랜잭션이 부분적으로 수행되지 않는다.
트랜잭션을 커밋했는데 문제가 발생하여 롤백하는 경우 그 이후에 모두 수행되지 않음을 보장하는 것을 말한다.
트랜잭션 단위로 여러 로직들을 묶을 때 외부 API를 호출하는 것이 있으면 안 된다.
트랜잭션 전파
트랜잭션을 수행할 때 커넥션 단위로 수행하기 때문에 커넥션 객체를 넘겨서 수행해야 한다. 하지만 이를 매번 넘겨주기가 어렵기 때문에 넘겨서 수행하지 않고 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것을 트랜잭션 전파라고 한다.
일관성(Consistency)
일관성은 허용된 방식으로만 데이터를 변경해야 하는 것을 의미한다.
데이터베이스에 기록된 모든 데이터는 여러 가지 조건, 규칙에 따라 유효함을 가져야 한다.
격리성(Isolation)
격리성은 트랜잭션 수행 시 서로 간섭 없이 독립적으로 발생하는 것을 말한다.
복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동돼야 하고, 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 한다.
격리성은 여러 개의 격리 수준으로 나뉘어 격리성을 보장한다.
위로 갈수록 동시성이 강해지지만 격리성은 약해지고, 아래로 갈수록 동시성은 약해지고 격리성은 강해진다.
격리 수준에 따라 발생하는 현상
팬텀 리드
한 트랜잭션 내에서 동일한 쿼리를 보냈을 때 해당 조회 결과가 다른 경우를 말한다.
반복 가능하지 않은 조회
한 트랜잭션 내의 같은 행에 두 번 이상 조회가 발생했는데, 그 값이 다른 경우 발생한다.
팬텀 리드와 다른 점은 반복 가능하지 않은 조회는 행 값이 달라질 수도 있는데, 팬텀 리드는 다른 행이 선택될 수도 있다는 것을 의미한다.
더티 리드
한 트랜잭션이 실행 중일 때 다른 트랜잭션에 의해 수정되었지만 아직 커밋되지 않은 행의 데이터를 읽을 수 있을 때 발생한다.
격리 수준
SERIALIZABLE
- 트랜잭션을 순차적으로 진행시키는 것을 말한다.
- 여러 트랜잭션이 동시에 같은 행에 접근할 수 없다.
- 매우 엄격한 격리 수준으로 해당 행에 대해 격리시키고 이후 트랜잭션이 이 행에 대해 일어난다면 기다려야 한다.
- 교착 상태가 일어날 확률도 많고 가장 성능이 떨어지는 격리 수준이다.
REPEATABLE_READ
- 하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행을 추가하는 것은 막지 않는다. 따라서 이후에 추가된 행이 발견될 수도 있다.
- 다른 트랜잭션이 행을 읽거나 수정 혹은 삭제를 할 수 없으므로 결과적으로 반복 가능하지 않은 조회를 방지할 수 있다.
READ_COMMITTED
- 가장 많이 사용되는 격리 수준으로 MySQL8.0, PostgreSQL, SQL Server, 오라클에서 기본값으로 설정되어 있다.
- 다른 트랜잭션이 커밋하지 않은 정보를 읽을 수 없다. 즉, 커밋 완료된 데이터에 대해서만 조회를 허용한다. (더티 리드를 허용하지 않음)
하지만 어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정할 수 있기 때문에 같은 행을 다시 읽을 때 다른 내용이 발견될 수 있다.
READ_UNCOMMITTED
가장 낮은 격리 수준으로 하나의 트랜잭션이 커밋되기 이전에 다른 트랜잭션에 노출되는 문제가 있지만 가장 빠르다.
데이터 무결성을 위해 되도록이면 사용하지 않는 것이 이상적이나 몇몇 행이 제대로 조회되지 않더라도 괜찮은 거대한 양의 데이터를 어림잡아 집계하는 데는 사용하면 좋다.
이 수준에서는 더티 읽기가 허용된다.
지속성(Durability)
성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것을 의미한다.
데이터베이스에 시스템 장애가 발생해도 원래 상태로 복구하는 회복 기능이 있어야 함을 뜻한다.
데이터베이스는 지속성을 위해 체크섬, 저널링, 롤백 등의 기능을 제공한다.
체크섬: 중복 검사의 한 형태로, 오류 정정을 통해 송신된 자료의 무결성을 보호하는 단순한 방법이다.
저널링: 파일 시스템 또는 데이터베이스 시스템에 변경 사항을 반영하기 전에 로깅하는 것, 트랜잭션 등 변경 사항에 대한 로그를 남기는 것이다.
무결성(Integrity)
무결성이란 데이터의 정확성, 일관성, 유효성을 유지하는 것을 말하며 무결성이 유지되어야 데이터베이스에 저장된 데이터 값과 그 값에 해당하는 현실 세계의 실제 값이 일치하는지에 대한 신뢰가 생긴다.
무결성의 종류
개체 무결성 | 기본키로 선택된 필드는 빈 값을 허용하지 않는다. |
참조 무결성 | 서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지해야 한다. |
고유 무결성 | 특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우 그 속성 값은 모두 고유한 값을 가진다. |
NULL 무결성 | 특정 속성 값에 NULL이 올 수 없다는 조건이 주어진 경우 그 속성 값은 NULL이 될 수 없다는 제약 조건이다. |
'DB' 카테고리의 다른 글
MySQL - SELECT (1) | 2023.11.09 |
---|---|
MySQL - SQL (0) | 2023.11.09 |
MySQL (0) | 2023.11.08 |
데이터베이스 - ERD와 정규화 (0) | 2023.10.28 |
데이터베이스 (0) | 2023.10.26 |