들어가며

 

 

누군가 내게 2024년의 가장 큰 사건을 꼽으라면, 한강 작가의 "노벨 문학상 수상"을 말할 것 같다. 평소에 문학을 즐겨 읽는 사람은 아니지만 노벨 문학상의 위상은 알고 있기에, 우리나라에서 노벨 문학상을 수상한 작가가 나왔다는 사실이 매우 뜻깊게 다가왔기 때문이다.

 

또, 노벨 문학상 작품을 원서로 읽어볼 수 있다는 것이 어느 정도 큰 가치인지도 알고 있기에 노벨 문학상 수상 발표 직후에 이 가치를 누리기 위해 "작별하지 않는다"를 구매했다. 하지만 안타깝게도 한강 작가의 책이 품절되는 대란이 일어나면서 책을 주문해도 끊임없이 배송이 지연되는 상황이 일어났다. 그렇게 뒤늦게 온 책은 한 쪽 귀퉁이가 찍혀서 왔지만, 워낙 책을 구하기 어려웠기 때문에 별다른 반품 조치 없이 그냥 봤드랬다. (슬픈 실화)

 

노벨문학상 수상 이후 엿새 만에 한강 작가의 책 100만부가 팔릴 정도로 어마어마한 붐이 일어났었는데, 이로부터 시간이 지난 지금도 한강 작가의 노벨 문학상 수상이 불러온 독서 열풍이 지속되고 있는지, 노벨 문학상이 독서 붐을 일으킬 수 있는 한 줄기의 빛이 되었는지 궁금해졌다. 

 

이런 궁금증을 해소하기 위해서는 우선적으로 "독서 붐"에 대한 정의가 필요하다. 만일 독서 붐이 왔다면, 아래와 같은 지표가 개선되었을 것이라고 가정하고 분석을 진행해 보았다.

 

1. 노벨 문학상 수상 이후 도서 판매가 늘었을 것이다.

2. 노벨 문학상 수상 이후 책 대여량이 늘었을 것이다.

3. 노벨 문학상 수상 이후 독서 관련 액션 빈도가 늘었을 것이다.

 

이제 각 지표의 개선이 이뤄졌는지 하나 하나 확인해보는 단계를 거쳐보자!

 

1. 도서 판매가 늘었나요?

노벨 문학상 수상 이후 도서 판매가 늘었는지 확인하기 위해, 출판유통통합전산망에서 제공하는 종이책 판매 통계를 살펴보았다. (안타깝게도 전자책에 대해서는 통계를 제공하지 않았다.)

 

 

2024년의 도서 판매 부수를 보면, 다른 연도에 비해 10월의 판매량이 튀는 것을 확인할 수 있다. 10월에 한강 작가가 노벨 문학상을 수상하게 되면서, 한강 작가의 책 판매가 크게 늘게 된 영향이다.

(관련 기사 : 단비 같은 "한강 특수", 독서 문화 저변 확대 계기로)

 

그러나 2024년의 다른 월의 판매량을 살펴 보면, 2022년의 판매량과는 비슷하고, 2023년의 판매량보다는 낮게 나타난다. 월별로는 12~1월, 3월에 도서 판매량이 늘어나는 특징이 있다. 

 

해당 월에 책 판매량이 늘어나는 것은 도서 판매량의 대다수를 차지하는 "어린이/수험서"가 해당 기간에 많이 판매되기 때문이다. 아래 그래프에서 어린이, 수험서종이책 전체 판매량을 비교해 보면 판매량의 추이가 비슷함을 확인할 수 있다.

 

어린이, 수험서의 종이책 판매량

 

종이책의 전체 판매량

 

 

"어린이/수험서"가 전체 도서 판매량에 차지하는 비중이 큰데다가 한강 작가의 노벨 문학상 수상이 "어린이/수험서" 판매에 영향을 준다고 보기는 어렵다고 판단해서, 이를 제외한 도서 판매량을 다시 확인해 보았다.

 

 

여전히 2024년의 책 판매량은 2023년도의 판매량에 밑도는 것을 확인할 수 있다. 10월은 한강 작가의 책이 많이 판매되었기 때문에 다른 시기에 비해 책 판매량은 많지만, 11월 ~ 12월이 되면 다시 귀신같이 예전 수준으로 회귀해 버린다.

 

한강 작가의 노벨 문학상 수상이 책 판매량 전체에 영향을 주지는 못하더라도, 적어도 소설 장르의 책 판매에는 지속적으로 긍정적으로 영향을 미치지 않을까 가정하고 도서 분류별로 판매량을 다시 확인해 보았다.

 

소설책 판매량은 늘었나요?

 

소설 장르의 일별 도서 판매량 책만 떼놓고 보면 2024년 10월에 책 판매량이 급격히 늘어나고, 서서히 감소하는 것을 볼 수 있다. 12월에 다시 판매량이 더 늘어나고, 이후에는 2~3만 권 내외의 판매량을 보인다.

 

그런데 하루 2~3만 권의 판매가 되던 것은 과거에도 보이는 수준이기 때문에 노벨 문학상이 소설 장르 판매에 지속적으로 영향을 주고 있다고 말하기는 다소 미묘하다. 현 상태에서는 노벨 문학상이 소설 판매에 영향을 줬다고 보기도 어렵고, 영향을 주지 않았다고 말하기도 어렵다.

 

이렇게 특정 사건 이후에 어떤 현상이 새롭게 생겨나거나 바뀌었는지를 확인하기 위한 방법론 중 하나로 "인과추론"이 있다. 인과추론은 특정 처치에 대한 효과가 있는지를 분석하는 방법이다. 그리고 내 궁금증이었던 노벨 문학상 수상 이후에 소설 판매량이 증가했는가라는 질문은 "처치(노벨 문학상 수상) 이후 처치 효과가 지속적으로 유지되는가"라는 인과추론의 문제로 치환할 수 있다.

 

노벨 문학상의 진짜 효과를 파악하기 위해서는 "우리나라에서 노벨 문학상 수상자가 나오지 않았다"는 평행 우주의 데이터와 "노벨 문학상 수상자가 나와버린" 현재의 데이터를 놓고, 그 차이를 비교해야 한다. 그렇지만 우리는 "노벨 문학상 수상이 없었더라면, 소설 판매량이 어느 정도였을 것이다."에 대한 정보는 당연히 갖고 있지 않으므로 진짜 인과효과를 구할 수는 없다. 그렇지만 "노벨 문학상이 책 판매에 미치는 효과"를 대략적이라도 추정하기 위해서 가상의 통제집단(Synthetic Control) 을 만들어보는 시도를 해볼 수는 있다.

 

가상의 통제집단이란 처치 집단의 반사실(Counterfactual)을 흉내내도록 하기 위해, 현재의 통제집단을 조합해서 만들어 내는 새로운 통제집단을 의미한다. CausalImpact라는 패키지(라이브러리)를 사용하면 간단히 함수를 써서 쉽게 가상의 통제집단을 만들 수 있는데, 이를 위해서는 몇 가지 가정을 만족해야 한다. (CausalImpact에 대한 자세한 설명은 해당 페이지를 참고하면 좋을 것 같다.)

  • 통제집단은 처치의 영향을 받지 않아야 한다.
  • 처치를 받기 전의 공변량과 종속변수의 관계는 처치를 받은 이후에도 비슷하게 유지되어야 한다. 즉, 통제집단의 추세가 비교적 안정적으로 유지되어야 한다는 가정이 필요하다.
  • 베이지안 방법론을 쓰기 때문에 사전 분포(Prior)를 가정한다. (사실 이건 이해를 잘 못했다.)

 

그러면 CausalImpact 패키지를 사용하기 전에 간단히 통제변수 후보군들의 추세를 살펴보자.

 

 

 

 

먼저 책 판매량에 비교적 큰 비중을 차지하고 있는 '사회과학', '어린이, 수험서'와

인문학 갈래에서는 소설과 비슷한 부분이 많다고 생각한 '철학, 종교' 부문의

일별 책 판매량 데이터를 놓고 비교해 보았다.

 

전반적으로 추세(Trend)는 변하지 않고 유지되고 있지만, 특정 월에 판매량이 튀는 주기가 있다. 

  • 사회과학, 어린이/수험서는 모두 3월에 책 판매량이 증가하며,
  • 철학, 종교 책은 12월에 책 판매량이 증가하는 특징이 보인다.

책 분류마다 특정 시점에 판매량이 튀는 주기(seasonality)는 있지만, 그렇다고 해서 처치 전후에 추세가 변하지는 않는다고 판단하여 3개 카테고리의 책 판매량을 가상의 통제집단을 만드는 후보군으로 사용하기로 했다.

 

CausalImpact 패키지를 활용하여 가상의 통제집단을 만든 결과는 아래 그래프와 같다.

  • 검은색 실선 - 실제 데이터
  • 파란색 점선 - 가상의 통제집단, 즉 가상으로 만든 실제 데이터의 반사실 데이터
  • 세로로 된 회색 점선 - 처치 시점

을 나타낸다는 사실을 알아두고 아래 그래프를 확인해 보자!

 

 

먼저 original(1번째 그래프)이라고 쓰인 패널이 보이는데, 이는 실제 데이터와 가상의 통제집단으로 만든 반사실 데이터를 비교하는 그래프로 보면 된다. 

 

처치 이전 시점에는 반사실(파란색 점선)이 실제 데이터(검은색 실선)를 잘 맞추는 것으로 보이지만, 노벨 문학상 수상 시기 직후에는 이 차이가 커지는 것을 확인할 수 있다. 그러다 시간이 지나면서 점점 반사실과 실제 데이터의 차이가 적어지는데 이는 노벨 문학상이 소설 판매량에 미치는 긍정적인 효과가 시간이 갈수록 사라진다는 것을 의미한다. (좀 더 정확하게는 노벨 문학상이 미치는 인과효과가 통계적으로 유의미하다고 볼 수 없다고 해석 가능하다.)

 

pointwise 패널(2번째 그래프)과 cumulative 패널 (3번째 그래프)은 처치(인과)효과를 나타내는 그래프인데, pointwise는 일별로 각각 처치 효과가 어느 정도 되는지를 표현하는 것이고 cumulative는 처치 이후의 인과효과를 모두 누적했을 때 얼마나 되는지를 나타낸다.

 

우리는 당연히 노벨 문학상 수상 직후에 소설 판매량이 늘었다는 사실은 알고 있으므로, 누적 인과효과를 나타내는 그래프보다는 각각 일별 인과효과를 나타내는 pointwise 패널에 주목해야 한다. 

 

 

 

 

처치 전후 시점만 확대해 보았다. 가로로 길게 뻗어 있는 회색 실선은 인과 효과가 0일 때를 나타내는데, 만일 인과효과가 있다면 파란색 점선이 회색 실선의 위에 위치해야 한다.

 

보면 미묘하게 파란색 점선이 회색 실선보다 위에 있는 것처럼 보이지만

하늘색 영역으로 된 신뢰구간이 회색 점선(인과효과 = 0)을 포함하고 있는 경우가 많으므로 인과효과가 통계적으로 유의미하다고 보기에는 어렵다.

 

👉 노벨 문학상 수상 이후 도서 판매량은 늘었으나 이 특수 효과가 오래 지속되지는 않은 것처럼 보인다.

 

2. 책 대여량이 늘었나요?

 

도서관의 대출 데이터를 구하고 싶었지만 데이터 수집 및 전처리에 한계가 있어 서울시의 서대문 도서관의 책 대출 데이터만 활용하여 살펴보았다. (일종의 샘플링 개념...인데 정말 대표성이 있을지는 쵸큼 의문..)

 

데이터는 도서관 정보나루에서 확인하여 사용하였다.

 

아래 그래프는 도서관의 월별 대출량을 나타내며, 분홍색으로 표현된 부분이 노벨 문학상 수상 이전(2023/01 ~ 2023/09), 민트색으로 표현된 부분이 노벨 문학상 수상 이후(2024/10 ~ 2024/12)이다.

 

도서관 대출량은 꾸준히 늘고 있다. 그러면 노벨 문학상 수상 이후에 대출량이 더 늘었다고 볼 수 있는가? 하면 그렇다고 보기에는 어렵다. 그저 기존의 상승 추세를 그대로 이어가는 것처럼 보인다.

 

 

 

통계적으로 표현하면 책 대여량 = \(\beta_0 + \beta_1\) * Trend + \(\beta_2\)* Trend * 노벨 문학상 수상 이후 라는 수식에서,

\(\beta_2\)가 통계적으로 유의미하지 않기 때문에 노벨 문학상이 책 대출량에 영향을 미치지 못한다고 볼 수 있다.

 

다만, 노벨 문학상이 한강 작가의 책을 더 빌리게 하는 것처럼은 보인다. (어떻게 보면 당연한 이야기지만..)

 

 

위의 그래프는 저자가 한강 작가인 책의 대출량을 전체 책 대출량으로 나눈 것이다. 보면 2024-10 이후 한강 작가의 책을 빌려가는 비율이 급증한 것을 확인할 수 있다.

 

👉 노벨 문학상이 책 대여량에 영향을 미치지는 못했지만, 책을 빌려가는 사람들이 한강 작가의 책을 더 빌려가도록 만든 것으로 보인다.

 

3. 독서 관련 액션이 늘었나요?

 

먼저 사람들이 독서에 대한 관심이 늘었다면, 책을 구매하려는 액션이 더 늘어났을 것이라고 가정했다.

책을 구매한다고 하면 '알라딘', '교보문고'와 같은 온라인 서점을 검색할 것으로 보고 두 키워드의 검색량에 변화가 있는지를 살펴보았다. (처치 시점을 좀 더 쉽게 구분할 수 있도록 한강 작가의 책 "채식주의자"의 검색량도 함께 살펴보았다.)

 

출처 : 네이버 데이터랩

 

보면 특별히 노벨 문학상 수상 이후 온라인 서점의 검색량이 늘었다고 보긴 어렵다.

교보문고의 2024-12월의 검색량이 늘어나기는 했으나, 이는 "이처럼 사소한 것들" 영화 개봉과 함께 책의 관심이 증가했기 때문으로 보이며 일시적 이벤트에 가까운 것을 확인할 수 있다.

 

유튜브에 독서 관련 내용을 검색하는 빈도가 늘어났는지를 확인하기 위해 몇 가지 키워드의 검색량 추이를 확인해 보았다.

 

출처 : 구글 트렌드

 

"책 추천" 키워드나 "독서" 키워드의 검색량이 미묘하게 늘어나고 있는 것처럼은 보이지만, 12월에 해당 키워드의 검색량이 늘어나는 주기랑 겹쳐서 해석에 모호한 지점이 있다.

 

코에 걸면 코걸이 / 귀에 걸면 귀걸이 식의 해석이 가능하기 때문에 독서 관련 검색 빈도가 늘었는지는 판단이 불가능하고 보았다.

 

👉 독서 관련 액션이 늘었는지는 확인이 어렵다.

다만, 크게 두드러지는 증가 추세가 보이지는 않기 때문에 내가 기대한 바와는 다른 데이터가 나오기는 했다.

 

나가며

 

요약하면 노벨 문학상 수상은 독서 붐을 일으키기에는 다소 힘이 부족했다고 보인다. 독서 문화를 바꿀 수 있는 게임 체인저가 되지 않을까 기대했었는데, 이는 너무나도 나이브한 생각이었다. 

 

내가 기대한 것
철이 없었죠.. 변수 하나가 시장을 바꿀 수 있다고 생각한 자체가..

 

 

독서 문화는 굉장히 거대한 사회, 문화적 흐름인데 이를 "노벨 문학상 수상"이라는 처치 변수가 바꿀 수 있다고 본 것 자체가 너무 무모한 발상이었는지도 모르겠다.

 

다만, 시장 전체가 아니라 일부분만 놓고 보면 어떤 결과가 나올지는 모르겠다.

독서율은 꾸준히 줄어들어 왔지만, 꾸준히 책을 사는 사람들은 계속 책을 사고 있다.

 

출처 : KPIPA 출판산업 동향 (2023년 상반기)

 

2023년 상반기에는 서적 거래액이 감소하기는 했으나, 19년부터 22년까지 인터넷 서점의 상반기 매출액은 꾸준히 증가해 왔다. 

이를 통해 책을 읽고 있는 사람들이 책 구매를 꾸준히 해 오는 것으로 출판 시장이 유지되고 있는 것은 아닌지 짐작할 수 있다.

 

이들 대상, 그러니까 독서 인구로 편입된 사람들 대상으로는 노벨 문학상 수상이 조금 더 다른 온도일 수 있을 것 같다. 

 

"독서 문화", "독서 시장"이라는 큰 단위로는 변화가 미미해 보이지만, 책을 읽는 사람들 대상으로는 여전히 따뜻한, 가슴이 뛰는 그런 이벤트일 수도 있겠다는 생각이 들었다. (다만 데이터가 없어 포착하지 못했을 뿐..)

 

그리고,

  • 종이책 통계만 구했는데, 위의 독서 인구 중 꽤 많은 비중이 전자책을 읽기 때문에 전자책 통계까지 추가하면 다른 양상이 나올 수 있다는 점
  • 서평, 독후감 등의 SNS 게시글이 늘었는지 (노벨 문학상이 독서 문화를 발전시키는데 영향을 주었는지) 확인하지 못했다는 점
  • 좀 더 장기적인 관점에서 도서 판매량의 추세 및 주기에 변화가 있는지 확인하지 못했다는 점

은 채우지 못한 분석의 한계점으로 남는다. 

 

마지막으로, 어떻게 하면 독서 문화를 더 발전시킬 수 있을지에 대한 고민을 마지막 숙제(?)로 내보며, 글을 마무리해본다. 

 

데이터 출처

 

 

한국출판문화산업진흥원

KPIPA 출판산업 동향 (2023년 상반기) > 조사연구보고서 | 한국출판문화산업진흥원 대표 누리집

www.kpipa.or.kr

 

출판유통통합전산망

 

bnk.kpipa.or.kr

 

도서관 정보나루

전국 서울 부산 대구 인천 광주 대전 울산 세종 경기 강원 충북 충남 전북 전남 경북 경남 제주 전체 영유아(0~5) 유아(6~7) 초등(8~13) 청소년(14~19) 20대 30대 40대 50대 60대 이상 전체 영유아(남) 영유

www.data4library.kr

  • 네이버 데이터랩
  • 구글 트렌드