티스토리 뷰

Programming/JPA

[JPA] 영속성 관리

annajinee 2020. 11. 24. 10:28

 3.1 엔티티 매니저 팩토리와 엔티티 메니저

엔티티 매니저 팩토리 : 엔티티 매니저를 만드는 공장. 공장을 만드는 비용이 상당히 크기에 한개만 만들어서 애플리 케이션 전체에 공유하도록 설계됨. 반면에 공장에서 앤티티 매니저를 생성하는 비용은 거의 들지 않음

 

엔티티 매니저 팩토리는 여러 스레드가 동시에 접근해도 안전하므로 서로 다른 스레드 간에 공유해도 되지만, 엔티티 매니저는 여러 스레드가 동시에 접근하면 동시성 문제가 발생하므로 스레드 간에 절대 공유하면 안된다.

 

일반적인 웹 애플리케이션

 

EntityManagerFactory에서 다수의 엔티티 매니저를 생성

엔티티 매니저는 데이터 베이스 연결이 꼭 필요한 시점 까지 커넥션을 얻지 않는다. 

예를 들어 트랜잭션을 시작할 때 커넥션을 획득한다.  EntityManager2는 커넥션을 사용중인데 보통 트랜잭션을 시작할 때 커넥션을 획득한다. 

 

3.2 영속성 컨텍스트란

영속성 컨텍스트(persistence context) : 엔티티를 영구 저장하는 환경 (논리적 개념에 가까움)

엔티티 매니저로 엔티티를 저장하거나 조회하면 엔티티 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리한다.

 

persist() 메소드는 엔티티 메니저를 사용해서 회원 엔티티를 영속성 컨텍스트에 저장한다.  

 

영속성 컨텍스트는 앤티티 매니저를 생성할 떄 하나 만들어지고 앤티티 매니저를 통해서 영속성 컨텍스트에 접근 할 수 있고 영속성 컨텍스트를 관리 할 수 있다. 

* 여러 엔티티 매니저가 같은 영속성 컨텍스트에 접근 할 수도 있다.  --> 11장 참고 

 

3.3 엔티티의 생명주기 

엔티티에는 4가지 상태가 존재한다.

 

  • 비영속 (new/ transient) : 영속성 컨텍스트와 전혀 관계가 없는 상태
  • 영속 (managed) : 영속성 컨텍스트에 저장된 상태
  • 준영속 (detached) : 영속성 컨텍스트에 저장되었다가 분리된 상태
  • 삭제 (removed) : 삭제된 상태

엔티티의 생명 주기

비영속 (new/ transient)

엔티티 객체를 생성한 순수한 객체 상태, 저장하지 않았다.  따라서 영속성 컨텍스트와 데이터 베이스와는 전혀 관련이 없다. 

 

영속 (managed)

엔티티 매니저를 통해서 영속성 컨텍스트에 저장했다. 이렇게 영속성 컨텍스트가 관리하는 엔티티를 영속 상태라고 한다. 

 

준영속 (detached)

영속성 컨텍스트가 관리하던 영속 상태의 엔티티를 영속성 컨텍스트가 관리 하지 않으면 준영속 상태가 된다. em.close()를 호출해서 영속성 컨텍스트를 닫거나 em.clear()를 호출해서 영속성 컨텍스트를 초기화 해도 영속성 컨텍스트가 관리하던 영속 상태의 엔티티는 준영속 상태가 된다. 

 

삭제 (removed)

엔티티를 영속성 컨텍스트와 데이터 베이스에서 삭제한다. 

 

 

3.4 영속성 컨텍스트의 특징

영속성 컨텍스트의 특징은 다음과 같다.

 

영속성 컨텍스트와 식별값

영속성 컨텍스트는 엔티티를 식별자 값 (@Id로 테이블의 기본 키와 매핑한 값으로 구분한다. 따라서 영속 상태는 식별자 값이 반드시 있어야한다. 식별자 값이 없으면 예외가 발생한다. 

 

영속성 컨텍스트와 데이터 베이스 저장

JPA는 보통 트랜잭션을 커밋하는 순간 영속성 컨텍스트에 새로 저장된 엔티티를 데이터베이스에 반영하는데 이것을 플러시(flush)라고 한다. 

 

영속성 컨텍스트가 엔티티를 관리하면 다음과 같은 장점이 있다. 

  • 1차 캐시
  • 동일성 보장
  • 트랜잭션을 지원하는 쓰기 지연
  • 변경 감지
  • 지연로딩 

 

엔티티 조회 

영속성 컨텍스트는 내부에 캐시를 가지고 있는데 이것을 1차 캐시라고 한다. 

영속 상태의 엔티티는 모두 이곳에 저장 된다. 

쉽게 이야기하면 영속성 컨텍스트 내부에 Map이 하나 있는데 키는 @Id로 매핑한 식별자고 값은 엔티티 인스턴스다. 

 

영속성 컨텍스트 1차 캐시 (DB 저장 전)

1차 캐시의 키는 식별자 값이다. 

엔티티 조회 시

Member member = em.find(Member.class, "member1");

 

find() 메소드를 보면 첫번 쨰 파라미터는 엔티티 클래스 타입이고, 두 번쨰는 조회할 엔티티의 식별자 값이다. 

//EntityManager.find() 메소드 정의 

public <T> find(Class<T> entityClass, Object primaryKey);

 

1차 캐시에서 조회

em.find()를 호출하면 먼저 1차 캐시에서 식별자 값으로 엔티티를 찾고 엔티티가 있으면 데이터 베이스를 조회 하지 않고 메모리에 있는 1차 캐시에서 엔티티를 조회 한다. -> 성능상 이점을 누릴 수 있음

만약 찾는 엔티티가 1차 캐시에 없으면 데이터 베이스에서 조회 한다.

1차 캐시에서 조회

다음 코드는 1차 캐시에 있는 엔티티를 조회한다. 

Member member = new Member();

member.setId("member1");

member.setUsername("회원1");

 

//1차 캐시에 저장됨

em.persist(member);

 

//1차 캐시에서 조회

Member findMember = em.find(Member.class, "member1");

 

데이터 베이스에서 조회 

만약 em.find()를 호출 했는데 엔티티가 1차 캐시에 없으면 엔티티 매니저는 데이터 베이스를 조회해서 엔티티를 생성한다. 

그리고 1차 캐시에 저장한 후에 영속 상태의 엔티티를 반환한다.

 

 Member findMember2 = em.find(Member.class, "member2");

 

1차 캐시에 없어 데이터 베이스 조회

 

영속 엔티티의 동일성 보장

다음 코드를 통해 식별자가 같은 엔티티 인스턴스를 조회해서 비교해보자

 

Member a = em.find(Member.class, "member1");

Member b = em.find(Member.class, "member2");

 

System.out.println(a==b); // 동일성 비교 

 

: 결과는 당연히 참이다. 

em.find(Member.class, "member1")를 반복해서 호출해도 영속성 컨텍스트는 1차 캐시에 있는 같은 엔티티 인스턴스를 반환한다. 

따라서 영속성 컨텍스트는 성능상 이점과 엔티티의 동일성을 보장한다.

 

cf. 동일성과 동등성

동일성(identity) : 실제 인스턴스가 같다. 따라서 참조 값을 비교하는 == 비교의 값이 같다. 

동등성(equality) : 실제 인스턴스는 다를 수 있지만 인스턴스가 가지고 있는 값이 같다. 자바에서 동등성 비교는 equals() 메소드를 구현해야 한다.

 

cf.

JPA는 1차 캐시를 통해 반복 가능한 읽기(REPEATABLE READ) 등급의 트랜잭션 격리 수준을 데이터 베이스가 아닌 애플리케이션 차원에서 제공한다는 장점이 있다.

 

 

엔티티 등록

엔티티 매니저는 트랜젝션을 커밋하기 직전까지 데이터 베이스에 엔티티를 저장 하지 않고 내부 쿼리 저장소에 INSERT SQL을 차곡차곡 모아둔다. 그리고 트랜잭션을 커밋할 때 모아둔 쿼리를 데이터 베이스에 보내는데 이것을 트랜잭션을 지원하는 쓰기 지연(transactinal write-behind)이라 한다.

쓰기 지연, 회원 A,B 영속

영속성 컨텍스트는 1차 캐시에 회원 엔티티를 저장하면서 동시에 회원 엔티티 정보로 등록 쿼리를 만든다. 

그리고 만들어진 등록 쿼리를 쓰기 지연 SQL 저장소에 보관한다. 

현재 쓰기 지연 SQL 저장소에는 등록 쿼리가 2건 저장 되었다. 

 

쓰기 지연, 커밋

마지막으로 트렌잭션을 커밋했다. 

트랜잭션을 커밋하면 엔티티 매니저는 우선 영속성 컨텍스트를 플러시 한다. 

플러시는 영속성 컨텍스트의 변경 내용을 데이터 베이스에 동기화하는 작업인데 이때 등록, 수정, 삭제한 엔티티를 데이터 베이스에 반영한다. 

좀 더 구체적으로 이야기 하면 쓰기 지연 SQL 저장소에 모인 쿼리를 데이터 베이스에 보낸다. 이렇게 영속성 컨텍스트의 변경 내용을 데이터 베이스에 동기화 한 후에 실제 데이터 베이스 트랜잭션을 커밋한다. 

 

 

트랜잭션을 지원하는 쓰기 지연이 가능한 이유

다음 로직을 2가지 경우로 생각해보자.

 

begin(); // 트랜잭션 시작

 

save(A); 

save(B);

save(C);

 

commit(); // 트랜잭션 커밋

 

1. 데이터를 저장하는 즉시 등록 쿼리를 데이터 베이스에 보낸다. 예제에서 save() 메소드를 호출할 떄마다 즉시 데이터 베이스에 등록 쿼리를 보낸다. 그리고 마지막에 트랜잭션을 커밋한다.

 

2. 데이터를 저장하면 등록 쿼리를 데이터 베이스에 보내지 않고 메모리에 모아 둔다. 그리고 트랜잭션을 커밋할 떄 모아둔 등록 쿼리를 데이터 베이스에 보낸 후에 커밋한다. 

 

트랜잭션 범위 안에서 실행되므로 둘의 결과는 같다. 

A, B, C 모두 트랜잭션을 커밋하면 함게 저장되고 롤백하면 함께 저장되지 않는다. 

등록 쿼리를 그떄 그때 데이터 베이스에 전달해도 트랜잭션을 커밋하지 않으면 아무 소용이 없다. 

어떻게든 커밋 직전에만 데이터 베이스에 SQL을 전달하면 된다. 

이것이 트랜잭션을 지원하는 쓰기 지연이 가능한 이유다. 

이 기능을 잘 활용하면 모아둔 등록 쿼리를 데이터 베이스에 한번에 전달해서 성능을 최적화 할 수 있다. 

 

 

변경 감지

JPA로 엔티티를 수정할 떄는 단순히 엔티티를 조회해서 데이터만 변경하면 된다.

 

// 영속 엔티티 데이터의 수정

memberA.setUsername("hi");

memberA.setAge(10); 

->  수정 쿼리를 직접 작성하지 않고 변경감지로 자동 반영

 

엔티티의 변경사항을 데이터 베이스에 자동으로 반영하는 기능을 변경 감지(dirty checking)라 한다. 

변경 감지

JPA는 엔티티를 영속성 컨텍스트에 보관할 때, 최초 상태를 복사해서 저장해두는데 이것을 스냅샷이라 한다. 

그리고 플러시 시점에 스냅샷과 엔티티를 비교해서 변경된 엔티티를 찾는다. 

 

  1. 트랜잭션을 커밋하면 엔티티 매니저 내부에서 먼저 플러시(flush())가 호출 된다.
  2. 엔티티와 스냅샷을 비교해서 변경된 엔티티를 찾는다. 
  3. 변경된 엔티티가 있으면 수정 쿼리를 생성해서 쓰기 지연 SQL 저장소에 보낸다. 
  4. 쓰기 지연 저장소의 SQL을 데이터 베이스에 보낸다. 
  5. 데이터 베이스 트랜잭션을 커밋한다. 

변경 감지는 영속성 컨텍스트가 고나리하는 영속 상태의 엔티티에만 적용된다. 

JPA의 기본 전략은 엔티티의 모든 필드를 업데이트 한다. 

이렇게 모든 필드를 사용하면 데이터 베이스에 보내는 데이터 전송량이 증가하는 단점이 있지만, 다음과 같은 장점으로 인해 모든 필드를 업데이트한다.

 

  • 모든 필드를 사용하면 수정 쿼리가 항상 같다. (물론 바인딩 되는 데이터는 다름). 따라서 애플리케이션 로딩 시점에 수정 쿼리를 미리 생성해두고 재사용 할 수 있다. 
  • 데이터 베이스에 동일한 쿼리를 보내면 데이터 베이스는 이전에 한 번 파싱된 쿼리를 재사용 할 수 있다.

필드가 많거나 저장되는 내용이 너무 크면 수정된 데이터만 사용해서 동적으로 UPDATE SQL을 생성하는 전략을 선택하면 된다. (하이버네이트 확장 기능 이용 - @org.hibernate.annotatioin.DynamicUpdate)

참고로 데이터를 저장할 때 데이터가 존재하는(null이 아닌) 필드만으로 INSERT SQL을 동적으로 생성하는 @DynamicInsert도 있다. 

 

cf. 

상황에 따라 다르지만 컬럼이 대략 30개 이상 되면 기본 방법인 정적 수정 쿼리보다 @DynamicUpdate를 사용한 동적 수정 쿼리가 빠르다고 한다. 가장 정확한 것은 본인의 환경에서 직접 테스트 해봐야한다. 

추천하는 방법은 기본 전략을 사용하고, 최적화가 필요할 정도로 느리면 그때 전략을 수정하면 된다. 

 

 

엔티티 삭제

앤티티를 삭제하려면 먼저 삭제 대상 엔티티를 조회 해야 한다. 

 

Member memberA = em.find(Member.class, "memberA"); // 삭제 대상 엔티티 조회

em.remove(memberA); // 엔티티 삭제

 

em.remove() 에 삭제 대상 엔티티를 넘겨주면 엔티티를 삭제한다. 

물론 엔티티를 즉시 삭제하는 것이 아니라 엔티티 등록과 비슷하게 삭제 쿼리를 쓰기 지연 SQL 저장소에 등록한다.

이후 트랜잭션을 커밋해서 플러시를 호출하면 실제 데이터 베이스에 삭제 쿼리를 전달한다. 

참고로 em.remove(memberA)를 호출하는 순간 memberA는 영속성 컨텍스트에서 제거된다. 

이렇게 삭제된 엔티티는 재사용하지 말고 자연스럽게 가비지 컬렉션의 대상이 되도록 두는 것이 좋다. 

 

 

3.5 플러시

플러시(flush())는 영속성 컨텍스트의 변경 내용을 데이터 베이스에 반영한다. 

플러시를 실행하면 구체적으로 다음과 같은 일이 일어난다. 

 

  1. 변경 감지가 동작해서 영속성 컨텍스트에 있는 모든 엔티티를 스냅샷과 비교해서 수정된 엔티티를 찾는다. 수정된 엔티티는 수정 쿼리를 만들어 쓰기 지연 SQL 저장소에 등록한다. 
  2. 쓰기 지연 SQL 저장소의 쿼리를 데이터 베이스에 전송한다. (등록, 수정, 삭제 쿼리).

영속성 컨텍스트를 플러시하는 방법은 3가지 이다. 

 

  1. em.flush()를 직접 호출한다. (테스트나 다른 프레임워크와 JPA를 함께 사용할 떄를 제외 하고 거의 사용하지 않음)
  2. 트랜잭션 커밋 시 플러시가 자동 호출된다. 
  3. JPQL 쿼리 실행 시 플러시가 자동 호출된다. 

플러시 모드 옵션

엔티티 매니저에 플러시 모드를 직접 지정하려면 javax.persistence.FlushModeType을 사용하면 된다. 

 

FlushModeType.AUTO : 커밋이나 쿼리를 실행 할 떄 플러시(기본값)

FlushModeType.COMMIT : 커밋을 할 때만 플러시

 

플러시는 영속성 컨텍스트의 변경 내용을 데이터 베이스에 동기화 하는 것이다. 

그리고 데이터 데이스와 동기화를 최대한 늦추는 것이 가능한 이유는 트랜잭션이라는 작업단위가 있기 떄문이다. 

트랜잭션 커밋 직전에만 변경 내용을 테이터 베이스에 보내 동기화 하면 된다. 

 

 

3.6 준영속

영속성 컨텍스트가 관리하는 영속 상태의 엔티티가 영속성 컨텍스트에서 분리된 (detached) 것을 준영속 상태라 한다. 

따라서 준영속 상태의 엔티티는 영속성 컨텍스트가 제공하는 기능을 사용 할 수 없다. 

 

영속 상태의 엔티티를 준영속 상태로 만드는 방법은 크게 3가지이다. 

  1. em.detach(entity) : 특정 엔티티만 준영속 상태로 전환
  2. em.clear() : 영속성 컨텍스트를 완전히 초기화 
  3. em.close() : 영속성 컨텍스트를 종료

cf. 

영속상태의 엔티티는 주로 영속성 컨텍스트가 종료되면서 준영속 상태가 된다. 개발자가 직접 준영속 상태로 만드는 일은 드물다. 

 

 

준영속 상태의 특징

  • 거의 비영속에 가깝다 : 영속성 컨텍스트가 관리 하지않으므로 1차 캐시, 쓰기지연, 변경 감지, 지연 로딩을 포함한 영속성 컨텍스트가 제공하는 어떠한 기능도 동작하지 않는다. 
  • 식별자 값을 가지고 있다 : 비영속 상태는 식별자 값이 없을 수도 있지만 준영속 상태는 이미 한 번 영속 상태였으므로 반드시 식별자 값을 가지고 있다. 
  • 지연 로딩을 할 수 없다 : 지연 로딩(Lazy Loading)은 객체 대신 프록시 객체를 로딩해두고 해당 객체를 실제 사용할 때 영속성 컨텍스트를 통해 데이터를 불러오는 방법이다. 하지만 준영속 상태는 영속성 컨텍스트가 더는 관리 하지 않으므로 지연 로딩 시 문제가 발생한다.  

 

병합 : merge()

준영속 상태의 엔티티를 다시 영속 상태로 변경 하려면 병합을 사용하면 된다.

merge() 메소드는 준영속 상태의 엔티티를 받아서 그 정보로 새로운 영속 상태의 엔티티를 반환한다.

준영속 병합- 수정

 

3.7 정리

엔티티 매니저는 엔티티 매니저 팩토리에서 생성한다. 

자바를 직접 다루는 J2SE환경에서는 엔티티 매니저를 만들면 그 내부에 영속성 컨텍스트도 함께 만들어진다. 

이 영속성 컨텍스트는 엔티티 매니저를 통해서 접근 할 수 있다.

 

영속성 컨텍스트는 애플리케이션과 데이터 베이스 사이에서 객체를 보관하는 가상에 데이터 베이스 같은 역할을 한다.

영속성 컨텍스트 덕분에 1차 캐시, 동일성 보장, 트랜잭션을 지원하는 쓰기 지연, 변경 감지, 지연 로딩 기능을 사용 할 수 있다. 

 

영속성 컨텍스트에 저장한 엔티티는 플러시 시점에 데이터 베이스에 반영되는데 일반적으로 트랜잭션을 커밋할 떄 영속성 컨텍스트가 플러시 된다. 

 

영속성 컨텍스트가 관리하는 엔티티를 영속 상태의 엔티티 라고 하는데, 영속성 컨텍스트가 해당 엔티티를 더 이상 관리하지 못하면 그 엔티티는 준영속 상태의 엔티티라 한다. 

준영속 상태의 엔티티는 더는 영속성 컨텍스트의 관리를 받지 못하므로 영속성 컨텍스트가 제공하는 1차 캐시, 동일성 보장, 트랜잭션을 지원하는 쓰기지연, 변경 감지, 지연 로딩 같은 기능을 사용 할 수 없다. 

 

'Programming > JPA' 카테고리의 다른 글

[JPA] 값 타입  (0) 2020.11.26
[JPA] 프록시와 연관관계 정리  (0) 2020.11.26
[JPA] 엔티티 매핑  (0) 2020.11.24
[JPA] JPA란  (0) 2020.11.24
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함