페이징에서 JPA N +1 문제 해결하기

개요

JPA는 간편하게 쿼리문을 사용할 수 있는 장점이 있지만 일대다 관계 혹은 EAGER, LAZY 조회 전략에 따라서 N + 1 문제가 발생합니다. 도메인을 그냥 조회하는 법, DTO로 변환해서 조회하는 법 등 다양한 방법들이 있는데, 이번에는 QueryDsl에서 페이징을 할 때 N + 1 문제를 방지하면서 쿼리문을 최소한으로 유지하기 위한 전략을 알아보겠습니다.

문제 상황

페이징을 이용해서 스터디를 100개씩 조회하도록 합니다.

기존에는 Study M : N Account 관계를 가지고 있으므로, 중간 테이블로 StudyLikes 엔티티를 가지며 Study 1 : N StudyLikes의 관계를 가집니다. 스터디를 조회하고 나면, 각 스터디의 스터디 좋아요(StudyLikes)를 순회하며, 내가 좋아요를 했는지의 여부에 따라서 하트가 칠해집니다. 따라서, 지연로딩으로 컬렉션을 조회하는데, 모든 스터디 좋아요(StudyLikes)를 조회하므로 N + 1 문제가 발생합니다.

기존의 쿼리문

스터디 리스트 조회 시, Study 도메인에 SutdyLikes 도메인을 left join 하여 조회했습니다. 그런데 문제는 Study와 StudyLikes는 1: N 관계를 가지고 있으므로 from절에서 study를 기준으로 조회하면 @OneToMany 형태로 조회하게 됩니다.

즉, LAZY 설정과는 관련없이 자연스럽게 100개의 스터디의 연관관계에 있는 스터디 좋아요(StudyLikes) 엔티티를 모두 조회하게 되며, 쿼리문이 N + 1 로 100개가 추가됩니다.

(만약에 StudyLikes에서 또다른 @OneToMany 연관관계를 가지는 칼럼이 조회된다면, N * M 개의 DB 쿼리문이 나갈 수 있는 가능성이 있습니다.)

아래는 실제 쿼리문의 결과입니다

2022-09-28T00:51:46,588 INFO  [http-nio-9059-exec-1] c.e.b.c.AspectLog: com.example.bookclub.controller.StudyController.studyOpenList
Hibernate: 
    select
        study0_.study_id as study_id1_14_,
        .... 
    from
        study study0_ 
    where
        study0_.study_state=? 
    order by
        study0_.study_id desc limit ? offset ?
Hibernate: 
    select
        count(study0_.study_id) as col_0_0_ 
    from
        study study0_ 
    where
        study0_.study_state=?
Hibernate: 
    select
        studylikes0_.study_id as study_id5_17_0_,
        studylikes0_.studylike_id as studylik1_17_0_,
        studylikes0_.studylike_id as studylik1_17_1_,
        studylikes0_.created_date as created_2_17_1_,
        studylikes0_.updated_date as updated_3_17_1_,
        studylikes0_.account_id as account_4_17_1_,
        studylikes0_.study_id as study_id5_17_1_ 
    from
        study_like studylikes0_ 
    where
        studylikes0_.study_id=?
Hibernate: 
    select
        studylikes0_.study_id as study_id5_17_0_,
        studylikes0_.studylike_id as studylik1_17_0_,
        studylikes0_.studylike_id as studylik1_17_1_,
        studylikes0_.created_date as created_2_17_1_,
        studylikes0_.updated_date as updated_3_17_1_,
        studylikes0_.account_id as account_4_17_1_,
        studylikes0_.study_id as study_id5_17_1_ 
    from
        study_like studylikes0_ 
    where
        studylikes0_.study_id=?
        
        
        .....
        
    
    (study_like 조회 100 번)

먼저 Study 리스트를 조회하므로, 100개의 스터디를 조회하기 위한 쿼리문이 나갑니다.

또한, 페이징을 계산하는 관계로 count 쿼리를 하나 날렸습니다.

그리고 그 아래에는 스터디 좋아요(StudyLikes)가 100번 조회됩니다. N + 1 문제가 발생한 것입니다.

이를 해결할 수 있는 방법은 무엇일까요?

개선된 쿼리문(default_batch_fetch_size)

먼저 쿼리문에서 조인을 할 때는 2가지 규칙이 있습니다.

@ManyToOne은 join fetch 을 한다 ( 1개밖에 연관관계 로우가 없으므로 영향이 없다.)
@OneToMany의 컬렉션 조회는 지연로딩한다 (default_batch_fetch_size로 in 조회를 한다.)

@ManyToOne은 연관관계가 1개이므로 상관 없습니다. @OneToMany의 경우에는 default_batch_fetch_size 로 정한 수만큼 한번에 데이터를 끌어옵니다. 기본적으로 100개씩 조회를 한다고 하여, 100을 설정했습니다. 이제 페이징으로 특정 페이지를 이동하면, 100개를 한번에 가져옵니다.

설정파일에서 전역으로 100개를 설정했지만, @BatchSize를 사용해서 독립적으로 사이즈를 정할 수도 있습니다.

각 상황에 따라서 얼마나 조회하는지, 갑자기 너무 많은 DB를 조회하게 되어 성능상 이슈는 없는지 확인을 하고 적절하게 사이즈를 선택해야 합니다.

@OneToMany는 지연로딩 하면 되기 때문에 별도로 join을 할 필요가 없습니다.

조회 결과는 아래와 같습니다.

Hibernate: 
    select
        study0_.study_id as study_id1_14_,
        ...
    from
        study study0_ 
    where
        study0_.study_state=? 
    order by
        study0_.study_id desc limit ? offset ?
Hibernate: 
    select
        count(study0_.study_id) as col_0_0_ 
    from
        study study0_ 
    where
        study0_.study_state=?
Hibernate: 
    select
        studylikes0_.study_id as study_id5_17_1_,
        studylikes0_.studylike_id as studylik1_17_1_,
        studylikes0_.studylike_id as studylik1_17_0_,
        studylikes0_.created_date as created_2_17_0_,
        studylikes0_.updated_date as updated_3_17_0_,
        studylikes0_.account_id as account_4_17_0_,
        studylikes0_.study_id as study_id5_17_0_ 
    from
        study_like studylikes0_ 
    where
        studylikes0_.study_id in (
            ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, 
            ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, 
            ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, 
            ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, 
            ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?
        )
Hibernate: 
    select
        count(study0_.study_id) as col_0_0_ 
    from
        study study0_ 
    where
        study0_.study_state=?

100개의 스터디를 조회할 때, 스터디 좋아요(StudyLikes)는 in절에서 한번에 조회합니다. 기존에는 1 + N으로 나가던 쿼리가, 이제 1 + 1으로 2번만에 조회가 되도록 개선되었습니다.

결론

페이징 조회 시, default_batch_fetch_size을 활용하면 in절을 통해 한번에 데이터를 조회할 수 있다

하지만, 성능상 이슈가 발생하지 않는 선에서 적정 제한을 두고 활용한다.

참고

실전! 스프링 부트와 JPA 활용2 - API 개발과 성능 최적화

저작자표시 비영리 변경금지 (새창열림)

'문제 해결, 기술 비교 > 개인프로젝트(북클럽)' 카테고리의 다른 글

redis 저장소를 cache, session 전용으로 분리하기 (0)	2022.10.01
Redis eviction 정책은 무엇을 사용해야 할까? (0)	2022.09.28
Mysql Replication 구성하기 (3)	2022.06.29
Redis Persistence AOF vs RDB (0)	2022.06.28
Message Queues vs Pub/Sub (0)	2022.06.26

너도나도 함께 성장하기

페이징에서 JPA N +1 문제 해결하기

개요

문제 상황

기존의 쿼리문

개선된 쿼리문(default_batch_fetch_size)

결론

참고

'문제 해결, 기술 비교 > 개인프로젝트(북클럽)' 카테고리의 다른 글

티스토리툴바

페이징에서 JPA N +1 문제 해결하기

개요

문제 상황

기존의 쿼리문

개선된 쿼리문(default_batch_fetch_size)

결론

참고

'문제 해결, 기술 비교 > 개인프로젝트(북클럽)' 카테고리의 다른 글

관련글

티스토리툴바