생활의 달인을 즐겨보는 편은 아니지만, TV 채널을 여기저기 돌리다가 생활의 달인을 보게 될 때가 있다.
달인이라고 불리는 사람들은 십수년을 한 분야에 종사하며, 나름의 노하우를 익히고 그 노하우를 통해 일반적인 사람들이 해낼 수 없는 수준의 것들을 해낸다. 그걸 보면 대개 "신기하다"하고 넘어갈 때가 많은데, 요즘은 종종 이런 생각을 한다.
'나도 저런 달인이 될 수 있을까?'
그러면 '데이터의 달인이 되기 위해서는 무엇이 필요할까?'라는 생각으로 자연스레 이어지는데, 'R이나 파이썬을 빠삭하게 쓸 수 있는 스킬, 단순한 기초 통계를 넘어 인과분석, 시계열 분석 등을 숨쉬듯 자연스럽게 쓸 수 있는 통계 지식, 시각화...' 등등 필요한 역량에 대한 생각은 꼬리를 물고 한없이 이어진다.
이 중 뭐 하나 필요없는 게 없겠지만, 우물 안 개구리, 아니 웅덩이 속 개구리 분석가인 내게 요즘 특히 와닿는 게 있었으니, 그게 바로 "데이터 문해력"이다.
데이터 문해력을 간단하게 말하면 "데이터를 실질적으로 활용할 수 있는 능력"이다. 단순히 데이터를 해석하거나 분류하는 것을 넘어, "진짜 분석"을 할 수 있도록 데이터를 잘 이해하고, 써먹을 수 있는 것이라고 할 수 있다.
데이터 문해력(Data Literacy)이라는 개념을 알게 된 건 추천 받은 책에서였지만, 단지 용어를 몰랐을 따름이지 "데이터 분석가"라는 직종으로 전직하기 전부터 비슷한 이야기를 들어오긴 했다.(잘 안 됐을 따름이지.....)
갑자기 데이터 문해력을 몰랐지만 사실은 알고 있었다는 뜬금없는 이야기를 하는 것은,
- 데이터 문해력이라는 것은 단순히 "데이터"에만 국한되지 않는, 어떤 업무에든 적용할 수 있는 일반론적인 내용일 수 있다는 내용을 전달하기 위함이고,
- 어떤 업무에든 적용할 수 있다는 것은, 결국 어떤 업무에든 다 필요하다는 것을 전달하기 위함이고,
- 그렇기에 데이터 문해력이 일반론적으로 들릴 수 있어도, 사실은 굉장히 중요한 요소임을 빌드업하기 위함이다.
특히나 업무에 고오급 통계 분석을 사용하거나, 최-신 머신러닝 기술을 적용할 일보다는
우리의 서비스가 잘 운영되고 있는지 확인하고, 관련해서 어떻게 하면 내가 데이터로 확인한 것들을 잘 전달하고 설득할 수 있을지 고민할 일이 더 많은지라 데이터 분석가의 밥벌이, 그리고 데이터 달인이 되기 위한 첫 걸음으로 "데이터 문해력"을 다루게 되었다. (빌드업이 길었다.)
애송이 of 애송이 데이터 분석가로서, 다음 두 권의 책을 읽고 느낀 점을 정리해본다.
1. 가설이 중요하다.
데이터 분석가로 전직하기 전에 팀장님께 자주 들었던 이야기 중에 하나다.
신입인데다, 가설이란 용어를 통계학 수업에서만 들었던, 그러니까 지금보다 더 애송이었던 과거의 나는 가설이라는 말을 듣고 "영가설/귀무가설과 대립가설"에 대한 엉뚱한 생각을 하고 있었는데, 엄밀히 말하면 그런 종류의 가설은 아니다.
가설 = 내가 무엇을 하고 싶은 건지에 대한 정의, 즉 목적에 대한 것이다.
가령, 이번에 'A 이벤트를 했는데 효과가 어떤지 볼까?'라는 것은 가설로서 불충분하다. "효과"에 대한 것이 명확하게 정의가 되지 않았기 때문이다.
A 이벤트를 통해 우리가 기대하는 것이 무엇인지?
- 잔존율 개선이 일어났나?
- 매출이 증가했는지?
등에 대한 문제 정의가 보다 명확해야 한다는 것이다.
그러고 나서야 내가 무슨 지표를 통해 다음의 가설을 확인할 수 있을지 정할 수 있게 된다.
이것도 예를 들면, "A 이벤트를 통해 매출이 증가했을 것이다"라는 가설을 증명하기 위해서
- 매출 증가를 무슨 지표로 볼 것인가? -> ARPU? ARPPU?
- 전반적인 매출을 볼 것인가? 이벤트 타겟이 되는 대상 위주로 볼 것인가? 유저 유형을 더 쪼개서 볼 수는 없을까?
- 결제액이 안 늘어도 BU rate가 증가했다면 이 또한 의미가 있다고 볼 수 있지 않을까?
등에 대한 지표 정의를 할 수 있겠다.
2. 원인을 찾기 위한 고민이 필요하다.
만일 우리 서비스에서 장기 잔존율이 감소하고 있다고 가정해보자. 이것 자체가 문제인지, 아니면 이로 말미암아 발생할 다른 문제를 문제로 정의할지는 더 고민해야 할 문제지만 여기서는 "장기 잔존율이 감소하는 상황" 그 자체를 문제라고 가정해보자.
만약 여기서 데이터를 기반으로 의사결정을 하지 않는다면, 장기 잔존율을 높이기 위해 기깔나는 프로모션에 대한 아이디어만을 모으려고 할 수 있겠다.
하지만, 데이터 문해력을 갖춘 사람이라면 문제의 원인을 찾는 것부터 선행해야 한다.
- 외부적 요인이 개입하지는 않았을까? 다른 경쟁사의 약진으로 인해 우리 서비스의 고객/유저가 빠지고 있는 건 아닐까? 아니면 시장 전반적인 요인으로 서비스를 이용하는 유저가 전반적으로 감소하고 있지는 않나?
- 아니면 자사 서비스 자체에 문제가 생겼나? 이전에 비해 멤버십을 유지하기 위한 마케팅 활동들이 줄어들었나?
외부적 요인과 내부적 요인에 대해 고려하고, 이후에 각 요인들을 검증하기 위해 데이터를 수집, 분석하여 결과를 도출한다. 데이터를 수집하고 분석하는 것은 정말로 테크니컬한, 기술적인 영역의 업무겠지만 이를 위한 선행 작업으로 데이터 문해력을 활용한 원인 찾기가 필요하다는 것이다.
3. 구슬이 서말이어도 꿰어야 보배다.
문제도 정의했고, 나름의 원인을 찾아 검증도 해 보았다.
그 과정에서 뭔가 꼬리에 꼬리를 물고, 궁금한 부분이 생겼을 수도 있고, 여러 가지 데이터를 잔뜩 추출해서 이것 저것 확인해 봤을 수도 있다.
최종적으로 내 의견을 설득력 있게 전달하기 위해서는 결국 그 안에서 필요한 데이터를 잘 선별하고, 논리적으로 제시할 수 있어야 한다.
이를 위해서는
- 원인이나 해결방안으로 제시한 내용은 서로 중복이 있어서는 안 되고, 내용이 혼재되어서는 안 된다.
- MECE(Mutually Exclusive Collectively Exhaustive) 하기 위해서는 내용에 빠진 부분이 있어서도 안 되지만, 현실적으로 데이터를 구할 수 없는 부분도 존재할 수 있기에 임의로 제외했다.
- 데이터를 기반으로 So What?(=그래서 뭐 어쩌라고?) 하면 단순히 데이터를 해석하는 것에 끝나지 않고, 어떤 문제의식을 도출할 수 있어야 하고,
- 반대로 문제의식을 검증하기 위해 Why so?(=이게 그래서 왜 이런거야?)했을 때는 내가 찾은 데이터가 문제에 대한 증거가 될 수 있어야 한다.
뭔가 이렇게 볼 수도 있지 않을까? 싶은 어정쩡한 데이터는 이 과정에서 과감하게 제외할 수 있어야 한다. 확인한 데이터를 단순히 나열하는 것에 그치지 않고, 상대방을 설득하기 위해 논리적으로 데이터를 구성해 나가는 과정을 거치고 나서야 진정으로 데이터 분석을 한 번 다 했다고 볼 수 있겠다.
도술이나 무술을 배우기 위해 찾아갔지만, 근사한 건 알려주지 않고 허드렛일만 시키는 것에 불만을 품다가
나중에 위기에 닥쳐서야 자신이 했던 것들이 무공을 익히기 위한 기본기였음을 깨닫는 클리셰가 나온다.
데이터 분석가에게도 "머신러닝", "고급 통계기술", "화려한 프로그래밍 실력" 등이 으리으리한 무공이고, 이것을 갖추는 것이 매우 중요한 일이겠지만, "데이터 문해력"이 기본기로 갖춰져야만 이런 무공을 적재적소에 사용할 수 있지 않을까 싶다.
그런 의미에서 애송이 of 애송이 분석가인 내가 필수적으로 익혀야하는 건, 당장 눈앞에 보이는 삐까뻔쩍한 기술보다 이런 문해력일지도 모르겠다.
'일상생각' 카테고리의 다른 글
글또 7기를 시작하며 (0) | 2022.05.05 |
---|---|
글또 6기와 2021년을 마무리하며 (0) | 2021.12.30 |
피드백에 대한 고찰 - 좋은 피드백이란 무엇일까? (0) | 2021.10.09 |
글또 6기를 시작하며 (0) | 2021.07.25 |
글또 5기를 마치며 (0) | 2021.05.02 |