비록 그 기간이 길지는 않으나, 내 경력에는 "소셜 빅데이터 분석가"라는 것이 있다. 소셜 빅데이터 분석가라는 직무명을 말했을 때, 사람들은 데이터 분석가라는 직무명은 익숙해 하지만, 또 소셜 빅데이터라는 용어가 그다지 익숙하지 않아 하는 것 같다. 당장 구글링을 해봐도, "데이터 분석가"라는 검색결과는 분석가 개인이 작성하거나, 혹은 분석가 개인에게 도움이 되는 내용들, 어떻게 보면 일상에 녹아 있는 생생한 결과가 나오지만, 소셜 빅데이터에 대한 검색 결과는 개인보다는 기업이나 공공기관에서 작성한 것 같은, 그런 느낌의 글이 많다. 이는 아직까지 대중에게 "소셜 빅데이터"라는 용어가 그다지 익숙하지 않다는 방증이기도 하다. 소셜 빅데이터 분석가에 대한 글이 많지 않아 암묵적으로 소셜 빅데이터에 ..
분류 전체보기
약 6개월의 글또 활동을 마무리하는 글을 남겨보려고 한다. 뭔가 활동을 끝마치는 글을 쓰게 되니 뭔가 섭섭한 마음이 들기도 하다. 또, 이전에 회고 글을 썼을 때는 뭔가 해냈다는 마음으로 뿌듯한 마음이 컸었는데 이번에는 뿌듯함과 동시에 약간의 그림자가 남아 있어 스스로 의아한 마음이 들기도 하는데, 이런 생각을 글로 정리해보려고 한다. 활동 목표 활동 목표는 크게 2가지였다. 글쓰기의 즐거움을 느끼는 것글또 구성원 분들과 교류 기회를 많이 갖는 것이렇게 두 개였다. 다소 추상적인 목표이기는 한데, 내가 숲보다는 나무를 보는 경향이 있어서 목표를 구체적으로 잡으면 오히려 거기에 더 얽매일 것 같아서 목표를 다소 열어두었다. 이룬 것 글쓰기의 즐거움 느끼기 이 목표는 비교적 달성한 것 같다. 글감을 찾는 ..
회귀분석은 종속변수와 종속변수를 설명하는 설명변수의 조합으로, 변수 간 관계성을 규명하는데 사용되는 도구이다. 그래서인지 인과추론(Causal Inference)에서도, 머신러닝 등 예측(Prediction)에서도 마치 백종원 만능간장마냥 널리 사용되고 있다. 만일 예측 문제를 해결하기 위해 회귀분석을 사용한다면, 설명변수의 조합으로 종속변수를 얼마나 잘 맞출 수 있을지에 대해 관심을 갖게 되므로, 설명변수 각각의 회귀계수(Coefficient)보다는 MSE, MAE 와 같은 예측 지표에 관심을 더 가질 수 있을 것이다. 그렇지만, 처치(Treatment)가 결과변수(Outcome)에 어느 정도로 영향을 미치는지에 관심을 갖는다면, 처치 변수가 결과 변수에 미치는 영향력, 즉 처치변수의 회귀 계수를 중요..
내가 성장하고 있는 걸까, 내가 조직에 도움이 되는 사람일까 라는 고민을 꽤 오래 지속했던 적이 있다. 일에 보람을 느끼면서 조금씩 성장하는 내 자신을 보며 뿌듯해하는 그런 모습을 상상했었는데, 늘 마음먹은 대로 이뤄지지는 않았다. 슬럼프의 정의는 "자신의 실력을 제대로 발휘하지 못하는 부진 상태가 긴 시간 이어지는 상황"이라고 한다. 내 경우는 자신의 실력을 제대로 발휘하지 못한다기 보다는 자신의 성장에 대해 자신감이 떨어진 상태였기 때문에 엄밀히는 슬럼프라고 부르기는 어려울 수는 있겠다. 그렇지만, 약간은 무기력하고 뭔가 속상한 마음이 계속 들었다는 점에서는 넓은 범주에서 슬럼프로 볼 수 있을 것 같다. 슬럼프를 극복하기 위해 노력한 것 처음에는 이성적으로 생각하려 노력했다. 내가 이런 저런 점은 부..
배경 최근 매칭을 업무에 오랜만에 써보는 일이 있었다. 오랜만에 써봐서 잊고 있었는데 매칭은 은근 분석에 도움이 되어, 가끔씩이라도 쓰게 되는 일이 있는 것 같다는 생각이 들었다. 향후 다시 매칭을 써먹을 나를 위해, 그리고 매칭을 적용해보고 싶은 사람들을 위해 정리할 겸 글을 남기게 되었다. 글은 매칭의 개념, 매칭의 한계, 매칭 방법에 대한 간단한 소개, 매칭에 사용하는 코드(R 위주) 순으로 진행하려 한다. 매칭의 개념 및 목적 매칭은 간단히 말하면 Treatment 그룹(처치군 ; 처치를 받은 대상)과 Control 그룹(대조군 ; 처치를 받지 않은 대상) 간 특성이 비슷한 사람을 짝지어주는 것을 의미한다. 이러한 짝짓기가 필요한 이유는 Selection Bias(선택 편향) 때문인데, 선..
AI 만들기 : 강화학습과 인공신경망 완전 정복 강의 링크 강의 소개 제목 그대로 강화학습과 인공신경망에 대해 다루는 강의다. 조금 더 설명을 보태면, AI 입문자도 해당 강의를 통해 인공지능과 강화학습의 최신 방법론을 익힐 수 있다고 한다. 인공지능과 강화학습에 대한 로망은 가득하지만, 정작 별로 아는 건 없는 초보 중에 초보라 강화학습에 대한 공부를 계속 미뤄왔는데, 아래의 강의 소개를 보고 용기를 내어 강의를 신청했다. 강의를 듣기 위해서는 기초 수학과 Python에 대한 기초 문법 숙지가 필요하다고 설명하지만... 강의를 들어본 결과, 더 높은 수준의 지식이 필요할 것 같다. 이 부분에 대해서는 아래에 좀 더 자세히 설명하려고 한다. 강의의 구성은 크게 이론과 실습코드를 설명하는 2가지 파트로 되..
글을 쓰게 된 배경 막연하게 강화학습을 배워두면 "기획자 분들이 밸런스를 잡는데 도움을 줄 수 있지 않을까, 조직에 도움이 되지 않을까?"라는 마음으로, 강화학습을 마음에 품어 두고 있었다. 그러던 중, 우연히 포켓몬 레드버전을 강화학습을 시켜 플레이하는 과정의 영상을 보게 되었다. 인간의 개입 없이 적절하게 보상을 설계하는 것만으로 AI가 혼자서 태초마을에서 회색시티를 거쳐 달맞이산으로 가는 이 엄청난 여정의 영상을 보고 난 이후 강화학습은 어느덧 로망이 되어버렸다. 흥미로운 영상이다. 강화학습에 관심이 있다면 한 번쯤 보는 것도 추천한다. 그렇지만 섣불리 공부할 용기는 못내고, 강화학습 관련 책만 야금야금 모아오고 있었는데.... 글또에서 유데미 인강을 무료로 들을 수 있는 이벤트를 통해 "AI 만들..
글또 9기 활동이 절반 가량 진행될 즈음, 글쓰기 세미나가 열려 참석하게 되었다. (혹시나 글또를 모르시는 분이 있다면 요 링크 참고) 글쓰기 세미나에서는 글쓰기를 방해하는 요소를 탐색하고, 이를 극복하기 위해 어떻게 나만의 글쓰기 프로세스를 만들어 나갈 수 있을까를 주로 다뤘다. 개인적으로는 여러 가지 찔리는 부분도 많았고, 이건 그래도 잘 하고 있지 않나 하면서 스스로를 칭찬했던 부분도 있었는데 세미나 과제 겸 글쓰기에 대한 회고를 진행해 볼 겸 정리를 해보려고 한다. 현재의 글쓰기 프로세스 (이상적인 건 아님..) 1. 아이디어 탐색 생각나는 게 있으면 엄청 간략한 수준으로 기록을 해 놓는데 그게 대개 아래 항목과 같다. 내가 궁금했던 것 개념을 직관적으로 정리하면 좋을 것 같은 개념 (어렵게 공부..
조금은 솔직하게 부끄러운 고백을 하자면, 나는 아이돌 노래에 진심이다. TMI지만 2010년도에 샤이니, 에프엑스를 시작으로 아이돌 노래에 입문하게 되었고, 요즘은 JYP 소속사의 스트레이키즈와 엔믹스에 조금 진심이다. 엔믹스(Nmixx)가 누구야? 엔믹스라는 그룹은 생소하더라도, 뉴진스라든가, 아이브라는 그룹은 익숙한 사람들이 많을 것 같기는 하다. 엔믹스는 뉴진스, 아이브, 르세라핌과 같은 아이돌 그룹과 데뷔 시기가 비슷해 4세대 여자 아이돌로 분류되고는 있지만, 국내에서의 대중성은 조금 낮은 편이다. 구글 검색어 트렌드로 4세대 걸그룹의 검색량을 비교해보면, 대중성의 차이를 조금 가늠할 수 있다. 보라색으로 표시되는 아이브가 검색량으로는 가히 압도적인데, 특히 4월 부근에 정규앨범 I've 을 내면..
들어가며 요즘은 시계열 공부 위주로 진행하고 있다. 당장 "어디다 써먹을거야"라는 목표는 없지만, 시계열 개념을 알아야만 이해할 수 있는 영역들이 있어서 최근에는 시계열 개념을 다시 복습하고 있는 중이다. 일단 전통적인 통계 기반의 시계열(이라고 쓰고 ARIMA라고 읽는다.) 개념 공부를 마무리하는 차원에서 기록을 남긴다. Stationary(정상성), AR, MA, ACF, PACF, Unit Root Test, VAR, Cointegration의 개념 순서대로 정리했다. 개념을 직관적으로 풀어쓰려고 나름대로 노력했지만, 일단은 시계열에 대한 개념이 어느 정도 있는 사람이 한 번 가볍게 개념을 정리하면 좋을 것 같다는 의도로 글을 썼다. 만약 시계열 개념이 없더라도, 이런 개념들이 시계열 공부를 할 때..