분류 전체보기

· 일상생각
생활의 달인을 즐겨보는 편은 아니지만, TV 채널을 여기저기 돌리다가 생활의 달인을 보게 될 때가 있다. 달인이라고 불리는 사람들은 십수년을 한 분야에 종사하며, 나름의 노하우를 익히고 그 노하우를 통해 일반적인 사람들이 해낼 수 없는 수준의 것들을 해낸다. 그걸 보면 대개 "신기하다"하고 넘어갈 때가 많은데, 요즘은 종종 이런 생각을 한다. '나도 저런 달인이 될 수 있을까?' 그러면 '데이터의 달인이 되기 위해서는 무엇이 필요할까?'라는 생각으로 자연스레 이어지는데, 'R이나 파이썬을 빠삭하게 쓸 수 있는 스킬, 단순한 기초 통계를 넘어 인과분석, 시계열 분석 등을 숨쉬듯 자연스럽게 쓸 수 있는 통계 지식, 시각화...' 등등 필요한 역량에 대한 생각은 꼬리를 물고 한없이 이어진다. 이 중 뭐 하나 ..
· 일상생각
* 주의 : 이 글은 "피드백"이라는 소재를 딴 자기 고백의 글입니다. 한 개인의 부끄러운 흑역사가 쏟아질 예정이므로, 항마력이 약하신 분들은 게시글을 읽을 때 주의하시길 바랍니다. 근래 직장에서 피드백을 하게 되는 일이 많이 생겼다. 글쓰는 개발자 모임 글또 활동을 하면서 다른 분들이 쓰신 글에 대해 피드백을 그래도 조금씩 했었고, "피드백 유경험자니까 그래도 괜찮겠지?" 하며 조금은 만만하게 보기도 했던 것 같은데 피드백은 생각보다 만만하지 않았다. 1. 미시적인 피드백은 간단할 수도 있다. 사실 글또 활동에서의 피드백도 녹록치 않았다. 그 이유인즉슨 나만이 유독 기술적인 부분에 대한 베이스가 부족했기 때문이다. 그러니까 다른 분들은 차를 타고 부릉부릉, 비행기를 타고 슝슝 날아다닐 때 나만 뚜벅뚜벅..
· Statistics
오늘은 MLE와 관련하여 작성하는 마지막 포스팅으로, EM 알고리즘에 대해 글을 써보려고 한다. EM 알고리즘을 풀어쓰면 'expectation-maximization algorithm'으로, "기대값을 최대화하는 알고리즘"으로 직역할 수 있다. 그러면 EM 알고리즘은 "어떤 기대값"을 구하고자 하는 걸까, "무엇을 최대화"하려고 하는 걸까? EM 알고리즘이란? 이에 대한 해답을 얻기 위해 EM 알고리즘을 언제 사용하는지, 잠시 짚고 넘어갈 필요가 있다. EM 알고리즘은 일부 데이터의 정보가 없는 상황에서 MLE를 얻어야 할 때 자주 사용된다. 모수에 대한 추정치를 구해야 하는 상황에서 MLE를 구하기 위한 완전한 정보가 없다. 이 때, 모수를 초기값으로 세팅해놓고 불완전한 정보까지 포함한 likelih..
· Statistics
지난번 작성했던 글에 이어 오늘도 수리통계학, 그 중에서도 MLE(maximum likelihood estimation)에 대해 작성해보려고 한다. https://blessedby-clt.tistory.com/23 수리통계학 - 추정량을 선택하는 기준에 대하여 누군가 통계학이란 어떤 학문이냐고 묻는다면, 나는 "미지의 모수를 추정하는 학문"이라고 답할 것이다. '추정'이라는 것은 정확하지는 않지만 어슴프레하게나마 어떤 값을 맞춰보겠다는 것이 blessedby-clt.tistory.com MLE란 무엇인가 지난번 작성했던 글에서, likelihood는 X1, ..., Xn이 발생했고, 발생한 사실로 비추어볼때 어떤 모수가 도출될 가능성(likelihood)에 대한 것이다. 라고 간략하게 언급했는데, 조금은..
· Statistics
누군가 통계학이란 어떤 학문이냐고 묻는다면, 나는 "미지의 모수를 추정하는 학문"이라고 답할 것이다. '추정'이라는 것은 정확하지는 않지만 어슴프레하게나마 어떤 값을 맞춰보겠다는 것이고, 그것은 필연적으로 오차를 수반하게 된다. 결국 정확한 값을 맞힐 수 없음에도 불구하고 통계학을 사용하는 건, 대충 어느 정도까지 틀릴 수 있을 것인지에 대한 각을 봐서 "그나마" 좋은 추정치를 찾아가려고 하는 노력 때문이지 않을까 싶다. 수리통계학에서 다루는 것도 우리는 어떤 값을 이용해서 미지의 모수를 찾아나설 것인지, 이 중 어떤 추정량이 좋은 추정량(better estimator)인지? (추정) 미지의 모수를 추정한 값이 맞다, 그르다를 판단하고 싶을 때 우리는 어떤 기준을 세울 것인지(검정) 에 대한 부분이다. ..
· 일상생각
근황 글또 5기를 마치고, 조금 더 내실을 다지고 참여하려고 했었다. 그러니까 6기 신청기간 전까지 수리통계학 공부를 끝내지 못하면 글또 활동보다는 개인 공부에 더 집중하려고 했다. "어차피 글또에 참여하건, 말건 공부하는 건 똑같지 않느냐"고 반문하는 사람도 있겠지만, 글또에는 워낙 잘 하는 분들이 많아 기본기라도 다지고 들어가야 다른 분들을 조금이라도 따라갈 수 있을 것 같았다. 그러나 결국, 6기 신청기간 전까지 수리통계학 공부를 끝마치는데 실패했는데(그래도 시도를 했다는 것에 의의는 있지만), 번아웃인지, 슬럼프인지가 너무 심하게 와서 공부를 하는 것이 너무나 힘이 들었다... 회사 일을 잘 하고 싶어서 시작한 공부였는데, 슬럼프가 생기니까 아무래도 공부 동기는 부족할 수 밖에 없었을 것이다. 그..
· 독후감
글을 읽으면서 문장이 눈에 걸리는 데 없이, 그냥 스르륵 다 읽었다. 어렵지 않은 단어를 쓰지만, 그 안에 울림이 있어 독자로 하여금 책을 놓지 않게 몰입하게 만드는 것이 이 분의 장점인 것 같다는 생각을 했다. 이 책의 무엇이 좋냐고 하면, 콕 집어 어떤 구체적인 사실을 열거하기에 어렵다. 책을 읽으면서 내 안의 어떤 감정이 몽글몽글해지는 그 느낌이 드는데, 마치 어머니가 갓 지어준 밥 같다는 생각이 든다. 무척이나 따뜻하지만, 이런 밥상에 대해 절대적인 맛의 가치를 측정하기 어려운 것처럼, 그냥 이 책을 읽는 그 시간 동안이 따뜻해지는 그 순간이 좋은 것이다. 좋은 책은, 구태여 좋다고 설명하지 않아도 그냥 좋은 것 같다. 읽으면서 주변의 감사한 사람들에게, 혹은 이런 감성이 필요한 사람들에게 이 책..
· 독후감
교보문고 놀러갔을 때였나, 미니북을 할인해주는 행사가 있어서 '인간관계론', '인간실격', '세상을 보는 지혜' 이렇게 3권을 구매했었다. 미니북은 출퇴근 시간에 짬짬이 읽기 좋지 않을까? 라는 계산을 갖고 구매했었는데, 2호선은 지옥철이라는 것을 고려하지 못했다. 이렇게 띄엄띄엄 오랜 기간을 두고 읽게 된 영향도 있고, 책 자체도 이런 저런 에피소드의 반복이라 사실 책 띠지에 나와있는 내용처럼 "관계에 서툰 당신을 위한 인간관계의 고전"이라든지, "인간관계의 바이블"이라든지 이런 식으로 극찬은 못하겠다. 책의 핵심 메시지는 간결하다. "사람은 인정 받고 칭찬 받기를 좋아하기 때문에 누군가와 진정으로 관계를 맺고 싶다면 칭찬을 해라" 라는 것이다. 이건 그냥 환심과는 다르다. 아첨은 진심이 담기지 않은 ..
· 일상생각
작년 11월, 이런 출사표를 던지며 글또 5기 활동을 시작했습니다. blessedby-clt.tistory.com/2 입사 회고 & 글또 활동다짐 게임회사에서 데이터 분석(?) 직무로 일한지 어느덧 10개월이 다 되어간다. 짧다면 한없이 짧고, 길다고 하면 긴 기간인 것 같지만, 누군가 내게 ‘당신은 프로 데이터 분석가입니까?’라고 묻는 blessedby-clt.tistory.com 당시의 저는, (아니 어쩌면 지금도 마찬가지일수도 있겠지만) 30대가 되어서야 무언가 시작점에 섰다는 어떤 뽕(?)과 부담감을 동시에 느끼고 있었습니다. 사회가 바라보는 기준으로는 늦은 나이에, 신입으로 새로운 직무를 시작하게 되었기 때문에 "내가 너무 늦은 게 아닌가?", "그래도 늦은 만큼 뭔가 보여줘야 하지 않나?"라는..
· Statistics
시계열의 정상성 일반적으로 시계열에서 '정상성(Stationary)'은 굉장히 중요한 의미를 갖는다. 사실 시계열을 급하게 공부해서, 정확하고 또 적확하게 개념을 이해하고 사용한 것은 아니지만, 기계적으로 시계열 데이터를 다뤘던 대부분의 경우, 시계열 데이터가 정상성을 따르는지 확인하고, 정상성을 따르지 않는다면 차분 or 변환을 통해 정상성을 만족하는 형태로 바꾸어가며, ARIMA 모델을 만들어 나갔다. 정상성(Stationary)에 대해 간략하게 정리하면, 데이터 간의 자기 상관이 없는 경우를 의미한다. 즉, 특정 시점과 h 시점 이후의 시점의 데이터는 시차(lag)에만 영향을 받고, t 와 t+h 라는 시점 자체에는 영향을 받지 않는 것을 의미한다. 이러한 정상성을 띄는 대표적인 경우가 '백색잡음(..
오리duck
'분류 전체보기' 카테고리의 글 목록 (7 Page)