1. 사건의 전말 통계학과를 졸업하기는 했지만, 관련 전공 지식을 별로 사용할 일은 없었다. 하여 k means clustering도 이론으로만 어렴풋이 알고 있을 뿐, 관련해서 깊게 생각해본 적도 없었다. 알음알음 전공 수업을 듣거나, ADsP나 ADP 필기 공부하면서 알고 있는 내용이라고는 - 비지도 학습의 일종이다. - 임의로 할당한 초깃값을 갖고 알고리즘을 시작, 각 레코드를 초깃값에 가장 가까운 평균을 갖는 클러스터에 레코드를 할당하는 방식으로 분류 - 이상치에 영향을 많이 받으며, 최적 군집 수를 직접 찾아줘야 한다. 이 정도였다. 그러던 중, 최근 R&D 성격의 업무를 하면서, '데이터를 군집분석을 통해 좀 세분화해서 보면 좋지 않을까?'라는 생각에 kmeans clustering을 시도했었..
분류 전체보기
2020년이 저물어간다. '경자년 새해가 밝았습니다!'하고 왁자지껄한 게 엊그제 같은데, 곧 엄숙하게 '신축년 새해'를 맞이하게 생겼다. 늘 한 해를 마무리하는 시점에는 지나온 발자취가 아쉽기 마련이지만, 올해는 유독 한 게 없이 느껴졌다. 나는 정말로 올 한 해 '사회적 거리두기'밖에 한 게 없는지, 그리고 다가오는 새해에는 어떤 목표를 이루고 싶은지에 집중해서 글을 작성해보려고 한다. 2020년 공부했던 것 - 올 초에 지금의 회사에 입사하면서, SQL 쿼리 날리는 게 급하게 늘었다. 면접을 볼 때, 시험(?)을 보고 들어갔는데, 간신히 바늘구멍 들어가듯 통과해서 그런지 입사 전까지도 SQL 공부를 당부하셔서 입사 전까지 SQL 관련 책 2권을 뗐다. 그리고 일하면서 팀장님께서 이것저것 리뷰해주신 것..
글또 활동을 하면서 시계열 공부도 좀 팍팍 나가고, 파이썬 코딩 연습도 좀 팍팍 할 수 있을 줄 알았건만 이번 주에는 영 퇴근 후에 아무 것도 할 수 없었다. 업무 특성 상 야근을 할 정도로 급한 일들은 많이 없었는데, 멘탈 관리를 잘 하지 못한 것도 있었고(사실 이게 제일 큰 이유였다.), 업무가 잘 안 풀리기도 해서 집에서도 머리를 싸매고 있느라 따로 공부할 시간을 내지는 못했다. 현재 내 주 업무는 데이터를 기반으로 회의 자료를 만드는 것이다. 당장 어떤 커리어를 쌓고 싶다는 목표는 없지만, '읽는 이로 하여금 재미 있는 보고서를 쓰고 싶다'는 것은 데이터 분석가로서 되고 싶은, 어떻게 보면 커리어 전체를 관통하는 목표이기 때문에 업무를 할 때는 늘 진심 모드에 임하려고 애쓴다. (물론 사람인지라 ..
일을 하다보면, 개발자적 사고가 필요할 때가 있다. 가령 어떤 작업을 반복적으로 해야할 때가 있는데, 함수를 썼으면 편했겠다 싶으면서도 방법을 떠올리지 못해 멍청하게 일을 할 때가 많다. 😢 틈틈이 파이썬도 써볼겸, 프로그래밍 사고도 함양할 겸 기초적인 코딩 문제를 풀었던 내용을 정리하려고 한다. 문제 - 문제 링크 : py.checkio.org/en/mission/caps-lock/ Caps Lock mission. python coding challenges - Py.CheckiO Add short description py.checkio.org 문제를 간단히 설명하자면, 손가락이 뚱뚱한 Joe는 'a'키를 누르려고 할 때 'a'키 대신 caps lock키를 누르게 된다. 단, 대문자를 입력할 때는 ..
원래는 시계열을 공부해서 정리하려고 했는데, 회귀분석이 기억이 안 나서 회귀해버리고 말았다. 분명 회귀분석의 Regression이 그 회귀가 아닐텐데, 어쩐지 통계 공부를 하려고 마음을 먹으면 회귀분석으로 돌아가게 된다. 회귀분석은 공부할 때마다 늘 새로운데.. 매번 같은 내용을 공부하면서도, 다시 몰랐던 걸 알게 되면 거기서 오는 전율이 있다. 전율도 좋기는 하지만, 이번에는 정말로 헷갈리는 부분을 정리해서, 기억의 휘발을 줄여보려고 한다. 이해가 안 가는 걸 억지로 이해력을 주입시켜서 기록하는 거라, 틀린 부분이 있을 수도 있는데 혹시 틀린 부분이 있다면 알려주시면 감사하겠습니다. 😘 1. 회귀분석의 가정 통계학 전공인 '회귀분석'과목에서 배웠던 가정과, 경제학 전공인 '계량경제학'과목에서 배웠던 가..
어느 순간부터 TV를 잘 안 보게 되었지만, 그럼에도 불구하고 '백종원의 골목식당'은 나름 챙겨보는 편이다. 시청률을 의식한 탓이라 그런건지는 모르겠지만, 매 회차마다 소위 OO좌라고 불리우는 '빌런'역할의 사장님들이 출연하시는데 그걸 보는 시청자의 입장에서는 답답함과 분노를 느끼면서 묘한 중독성을 느끼게 된다. 왜 어른들이 막장드라마를 그렇게 챙겨보셨는지 골목식당을 보다보면 알 것 같기도 하다. 처음에는 부족한 맛, 서비스정신, 위생상태에 분노하다가, 중간부터는 외식업계의 한참 대선배격인 백종원 님이 '정도(正道)'를 알려주셔도 본인의 고집을 포기하지 못하거나, 핑계를 대는 모습이 보이면 답답해하고, 또 그러고 나면 '나야말로 욕할 자격이 있는건가?' 반성하게 된다. 사실 분석가, 아니 넓게 보면 회사..
게임회사에서 데이터 분석(?) 직무로 일한지 어느덧 10개월이 다 되어간다. 짧다면 한없이 짧고, 길다고 하면 긴 기간인 것 같지만, 누군가 내게 ‘당신은 프로 데이터 분석가입니까?’라고 묻는다면, 거기에 대해서 당당히 말할 자신은 아직 없는 것 같다. ‘데이터 분석가’로서의 역량 진단 자신감이 없는 데에는 여러 가지 이유가 있겠지만, 가장 큰 이유는 아직도 업무가 주어지면 막막하고 버겁기 때문인 것 같다. 물론 처음보다 나아진 부분이 아예 없는 건 아니다. 수습기간을 보낼 때는 ‘SQL 쿼리’를 작성하는 것부터 쉽지 않았다. 그 전에 IT 컨설턴트로 일할 때, 단기성 프로젝트에 투입돼서 3개월 간 SQL을 써본 게 다였고, 그 이후 리서처로만 2년 가까이 일하면서 그나마도 까맣게 잊어버렸기 때문에 초반..