‘생존’이 우선인 스타트업에게도 데이터 분석이 필요합니다, ML GDE 권정민

스타트업은 자본도, 인력도 충분하지 않습니다. 그럼에도 데이터에 소홀하면 안 되는 이유는 무엇일까요? 또 스타트업이 성장함에 따라 데이터를 바라보고 다루는 시각은 어떻게 달라져야 할까요?

그 답을 1월 COMMIT에서 들려주실 ML GDE(Machine Learning Google Developer Expert) 권정민 데이터 분석가를 먼저 만나 봤습니다. 다음은 세상은 데이터로 이뤄졌다고 생각하며, 데이터를 잘 활용할 방안을 16년여간 고민해온 권정민 님과의 문답입니다.

MLGDE권정민

Q. 데이터 분석 경력이 16년 가량이라고 들었어요. 당시에는 ‘데이터 분석’이란 말조차 생소했을 듯해요.

데이터 분석이라는 말이 아예 없지는 않았어요. 제조업에서는 시뮬레이션, 보험사에서는 통계 분석과 같은 데이터 관련 일이 있었습니다. IT 산업에서는 쌓여서 점점 거대해지는 데이터를 분석하려는 시도가 계속 있었죠. ‘데이터 과학’이라고 부르진 않았지만 비슷한 개념은 90년대 후반부터 있었고, 그 흐름에 올라탄 거죠.

Q. 그사이 데이터 분석에 대한 기업들의 인식은 얼마나 달라졌나요?

과거에 비하면 데이터 분석에 대한 투자가 커지긴 했어요. 빅데이터 등장 시점에 한 차례 크게 바뀌었고, AI가 대두되며 또 한 번 바뀌었습니다. 이제 많은 기업이 데이터 분석의 중요성을 실감하지만, ‘투자하면 결과가 나온다’고 성급하게 생각합니다. 모든 일이 그러하겠지만, 당장의 성과를 기대하기보다는 장기적인 관점에서 데이터 분석에 접근하는 게 중요합니다.

Q. 얘기를 들어보니, 데이터 분석이 쉽지 않은 분야 같네요.

그렇죠. 데이터 분석을 멋진 일이라고 생각하는 여러분의 기대와 달리 실제 데이터 분석은 성공보다 실패가 많습니다. 데이터 하나하나를 일일이 까 보기 전에는 어떤 스킬로 분석해도 결과를 예측하기 어렵기 때문이에요. 예를 들어 10GB짜리 데이터가 있다면, 이를 현실적으로 다 들여다볼 수 없지 않겠어요?

또, 캐글 등에서 접하게 되는 현업 밖의 데이터들은 대부분 잘 정제되어 있고 검증되어 있는 반면, 기업 내 데이터는 상상 이상으로 정제되지 않은 경우가 많습니다. 전처리와 관련된 문제 외에도 풀어야 할 문제가 산적해 있어요. 개인정보보호법이나 회사 내의 보안지침 같은 것도 그중 하나죠.

무엇보다 데이터 분석에 대한 오해 때문에 더 어려운 듯합니다. 데이터 분석이라고 하면 누구나 조금씩은 안다고 생각해요. 아예 모르면 다른 사람 얘기를 들을 텐데, 조금 안다고 여기니 다른 사람 말을 잘 안 듣고 안 받아들여요. 그런 점 때문에 현업에서 어려운 점이 있습니다.

Q. 데이터를 왜곡해 사람의 의도대로 해석하는 경우도 적지 않다 들었어요. 분석 결과를 해석하는 것은 결국 사람이기 때문인데요, 이런 왜곡에 빠지지 않으려면 어떤 점에 주의해야 할까요?

사람은 의도하지 않더라도 문제를 해결할 때 원하는 방향이 있기 마련입니다. 그래서 은연중에 객관적으로 보지 못하는 일이 생각보다 비일비재해요. 이런 일의 원인은 보통 데이터 조직에 힘이 없기 때문인데요. 쉽지는 않겠지만, ‘문제를 내는 사람’과 ‘결과를 내는 사람’이 다르면 해결할 수 있다고 봅니다. 보통은 문제를 낸 사람이 분석 결과를 가지고 실행하면서 본인이 원하는 대로 해석해서 사용하기 때문에 문제가 생기거든요.

데이터사이언티스트

Q. 데이터 분석 문화가 전사로 퍼져나가려면 어떤 노력을 해야 하나요? 정민 님은 어떻게 조직과 구성원의 인식을 바꿨는지 궁금해요.

데이터 분석이 데이터 분석가만의 일은 아닙니다. 데이터 분석이 거창하지 않던 때도 마케터나 기획자는 엑셀로 숫자를 집계하고 분석하고 있었죠. 이런 것이 바로 데이터 분석이에요.

조직 내 인식부터 바꿔야 합니다. 저는 데이터를 실제로 어떻게 보고 분석할 수 있는지 사내 교육을 진행했어요. 만약 교육할 여건이 안 된다면 데이터를 분석한 조직 구성원을 칭찬하는 문화를 만드는 것도 방법입니다. 데이터로 근거를 마련하면 다른 사람을 설득하기 쉽다는 점을 알리는 것도 좋겠네요. 무엇보다 데이터 분석으로 성과를 내면 데이터 분석에 대한 조직 내 관심을 높이고 인식을 바꿔나갈 수 있습니다.

Q. 데이터 분석가는 보통 어느 조직에 속해 있나요?

제가 거친 회사에서는 마케팅, 기획, CTO 산하 등 다양했습니다. 젯브레인(Jetbrain)에서 매년 파이참(PyCharm)을 쓰는 데이터 분석가를 대상으로 설문조사를 하는데, 그 결과를 봐도 데이터 분석가는 실제로 다양한 조직에 소속되어 있더라고요. 비즈니스에 따라, 어떤 문제를 푸는가에 따라서도 달라질 수 있고, 회사의 사정에 따라서도 다른 거 같아요.

Q. 그렇다면 데이터 분석가가 없는 초기 스타트업이라면 어떤 데이터부터 분석하는 게 좋을까요? 또 누가 하는 게 바람직할까요?

가장 먼저 봐야 할 데이터는 지표입니다. 초기 스타트업이라면 매출, 고객 숫자 정도만 봐도 되지만, 이후에는 고객이 어느 정도 유지되는지, 어떻게 고객을 늘릴 수 있을지를 봐야 해요. 고객과 제품의 연결과 관련된 데이터를 보면 좋을 것 같습니다.

사내에 데이터 분석가가 있으면 좋겠지만 없다면 데이터 분석이 필요한 사람이 하면 됩니다. 간단한 데이터 분석은 누구나 할 수 있어요. 마케팅뿐 아니라 제품 기획자도 ‘사용자가 제품의 기능을 어떻게 쓰는지’, ‘기껏 만든 기능을 사용자가 사용하지 않는 건 아닌지’ 봐야 해요.

한 가지 기억해야 할 것은 데이터와 관련이 없는 직무는 이제 없다는 점입니다. 실제 이 데이터가 도움이 되는지를 파악하고, 데이터를 집계해서 분석하는 능력은 누구에게나 필요해요.

Q. 스타트업은 생존이란 치열한 경쟁 속에 놓여있어 데이터 분석까지 하기에는 여력이 없는 곳도 많은 것 같아요. 여러 어려움에도 데이터에 소홀하지 않아야 하는 이유는 무엇일까요?

초기 스타트업, 즉 20명 이하 스타트업이라면 당연히 전문적인 데이터 분석까지는 필요 없습니다. 2000년 중반 ‘린 스타트업’이란 방법론이 나왔고 요즘에는 그로스 해킹을 이야기하고 있죠. 이런 방법론에서 가장 먼저 나오는 게 지표 설정입니다.

스타트업 초기에는 당연히 지표를 대시보드로 보는 정도면 충분할 거예요. 외부 홍보, 사내 MVP 지표 등을 보면 되겠지만, 20명 이상이 되면 사용자가 어떻게 움직이고 어떤 걸 만족하고 불만족하는지 봐야 합니다. 사용자 모두를 인터뷰하면 좋겠지만 현실적으로 불가능하죠. 그때부터는 싫든 좋든 데이터를 봐야 합니다.

Q. 정민 님의 최근 고민은 무엇인가요?

아직까지 이상적으로 데이터를 사용하는 회사를 보지 못했어요. 그런 회사를 만들려면 개인의 역량도 중요하지만, 어떻게 시스템을 만들고 그 과정에서 데이터 분석가는 어떤 역할을 해야 할지 고민하고 있습니다. 아직 풀지 못했어요.

Q. 스타트업의 데이터 활용을 주제로 2023년 1월 COMMIT에서 발표하실 텐데요. 주요 내용을 미리 소개 부탁드립니다.

스타트업마다 데이터를 활용하는 분야가 다릅니다. 회사마다의 사정이 있죠. 사용법도 제각각이고요. 그래도 스타트업에 공통적으로 적용할 수 있는 부분이 분명 있습니다. COMMIT에서는 많은 스타트업에 공통적으로 적용할 수 있는 데이터 분석 이야기를 전하려 합니다. 스타트업 규모에 따라 데이터를 바라보는 시각과 전략을 J 곡선에 비춰 설명하려고 준비하고 있어요.

Q. 이번 COMMIT은 누가 들으면 좋을까요?

스타트업에서 일하는 모두에게 도움이 될 거라 확신합니다. 데이터 분석가든 아니든 데이터를 쌓고 다룬다면 알아야 하고, 도움이 될 범용적인 내용을 준비했어요. 스타트업에 종사하신다면 오셔서 들어보시길 추천합니다. 데이터 분석 조직을 이제 만들려는 스타트업의 대표, 임원들에게도 유익할 거예요.

스타트업과 데이터 분석에 대한 자세한 이야기는 1월 11일 수요일, 구름스퀘어에서 열리는 구름 COMMIT에서 들을 수 있습니다. 신청하고 1월 COMMIT에서 만나요.

Edit Snow Design Lily

Posted by
goorm

ANYONE CAN DEVELOP