고등학생들이 나와 퀴즈를 풀며 최후의 1인을 가르는 텔레비전 프로그램. 마지막 50번 문제는 ‘흑점이 폭발해 플라즈마 입자가 방출되는 현상’이었다. 이 학생은 골든벨을 울릴 수 있는 마지막 문제 앞에서 한마디를 남기고 탈락했다. “문과라 죄송해요!” 줄여서 ‘문송’이라는 이 표현은 최근 젊은 세대들에게 익숙하다. 취업시장에서 이공계 졸업생의 인기가 높아지면서, 상대적으로 박탈감을 느끼게 된 인문계 학생들 사이에서 자주 쓰인다. 유사어로 ‘인문계의 90%가 논다’를 줄인 ‘인구론’이라는 신조어도 있다. 필자도 대학생 앞에서 강연할 기회가 있을 때마다 이런 질문을 듣는다. “인공지능이나 빅데이터가 점점 더 중요해진다는데, 문과 출신들은 괜찮을까요?”

필자도 문과 출신이다. IT와 빅데이터 분석이라는 생소한 분야에 발을 디딘 지 벌써 7년이 되었다. 개발자들이 말하는 “가능해요”가 사실 “며칠 밤을 새우면 가능하다”라는 뜻일 수 있다는 걸 이해하는 데 몇 년이 걸린 것 같다. 어쭙잖은 코딩 지식으로 마이에스큐엘(MySQL:데이터베이스 관리 프로그램) 쿼리를 쭈뼛쭈뼛 입력하느라 진땀을 뺀 적도 많았고, 소셜 네트워크 분석을 위한 데이터 코딩 방법을 능수능란하게 구사하는 데도 또 몇 년이 걸렸던 것 같다. 데이터 선처리 과정에서 맞닥뜨린 난관들을 해결하기 어려워, 대부분 함께 일하는 실력 있는 엔지니어들과의 협업을 통해 문제를 풀었다. “프로그래머가 되기 위해 진작부터 노력했더라면” “문과 대신 이과 전공을 택했더라면” 하며 후회한 게 한두 번이 아니다.

이세돌 9단과 알파고의 대전 이후 인공지능과 머신러닝(기계학습)이 급속히 각광을 받기 시작하면서, 필자도 개인적으로 이런 분석들을 배워보고 싶었다. 찾아보니, 수요가 많아서인지 마음만 먹으면 얼마든지 배울 길이 있었다. 물론 마음먹는 게 가장 어려웠다. 이 ‘허들’을 넘기는 가장 좋은 방법은, 일단 지르는 것이었다. 재작년에 통장 잔고를 생각하지 않고 유료 강좌를 결제했다. 수강료가 부담스러웠지만 허들을 넘은 나를 대견하게 여기며 3개월간 ‘완강’했다.

ⓒDS스쿨 제공지난 7월 한 교육기관에서 ‘초급자를 위한 파이선(Python:프로그래밍 언어)으로 데이터 분석하기’ 강의를 열었다.

수강을 마친 뒤 돌아보니 이론적인 부분은 명확해졌다. 실전에 약했다. 엔지니어의 도움 없이 머신러닝 알고리즘을 적용해 데이터를 분석하는 것은 여전히 만만치 않았다. 업무에 사용하려면 익히는 데 절대적인 시간을 투입해야 하는데 이 후속 학습이 쉽지 않았다. 결국 업무를 하다 보면 ‘신기술’을 쓰지 못하고 손에 익숙한 엑셀 같은 스프레드시트를 켜기 일쑤였다. 


그래도 허들 넘기를 멈추지 않았다. 최근에 코딩을 아예 모르더라도 한 달 만에 데이터 사이언티스트로 키워주겠다는, 다소 허풍처럼 들리는 강의를 신청했다. 강의안이 아예 없었고, 첫 시간부터 수강생들을 ‘캐글(kaggle:각종 데이터 분야 전문가들이 특정 문제를 해결하기 위해 서로 경쟁하는 커뮤니티형 플랫폼)’이라는 낯선 사이트에 접속하게 해 실전 문제를 풀도록 했다. 첫 주제는 타이태닉 생존자 예측하기. 고수들의 다양한 분석 결과와 점수에 비해 초보인 내 점수는 형편없었다. 뼈아픈 점수들을 ‘캐글’에 올려두면, 강사들의 깨알 같은 해설이 뒤따랐다. 궁금한 내용을 질문했고 답변을 다시 받아 적어가며 코드를 수정했다.

무료 온라인 공개 강의도 많아

그렇게 한 달을 따라가봤다. 빠른 피드백과 실전 학습 과정에서, 파이선(Python:프로그래밍 언어) 코딩에 대한 자신감이 생겼다. 과거에 진행했던 데이터 분석 프로젝트들도 이런 알고리즘이나 분석 방법을 활용했더라면 훨씬 더 효율적인 결과를 냈을 것이다. 문과 출신이라서 어려웠던 점은, 코드를 타이핑할 때 뒤따르는 주저함과 잦은 오타뿐이었다.

ⓒ시사IN 윤무영파이선(Python)으로 코딩을 하는 모습.

알파고의 연승에 힘입어 기계가 인간을 지배하는 날이 오지 않을까 하는 두려움이 퍼졌다. 그러나 기계 근육(로봇)이나 기계 두뇌(인공지능)도 법적으로 무언가를 소유할 수 있는 개인 혹은 법인의 지위를 갖추지 못한 상태다. 아무리 기계가 우월하더라도 기계를 통제할 수 있는 자본은 인간의 손에 있다. 물론 작동을 멈출 수 있는 전원 코드도 여전히 우리 손에 있다. 

그럼에도 불구하고 노동의 가치에 기계가 도전하는 현상은 거의 모든 분야에 걸쳐 문제를 일으킬 것이다. 역동적인 기술 발전 과정에서 기계와 인간의 관계는 지속적으로 재조정되고, 이런 조정은 개인이 감당할 수 있는 수준을 뛰어넘을 것이다. 4차 산업혁명 시대를 제도적으로 대비하기 위한 기본소득 논의가 전 세계적으로 활발하게 이뤄지는 이유다. 정치권과 산업계, 학계, 시민사회가 이런 사회적인 대비를 꾸준히 해야 한다. 더불어 개인들도 4차 산업혁명 시대에 능동적으로 대비할 수 있다. 가장 간단한 방법이 코딩이나 데이터 분석을 배워보는 것이다. 기계의 언어를 이해하는 프로그래머나 방대한 데이터를 분석하는 데이터분석가들이 ‘기계 근육과 기계 두뇌의 시대’에 점점 더 중요한 구실을 할 수밖에 없다.

배울 기회는 널려 있다. 무료 온라인 강의도 적지 않다. 대표적인 것이 코세라(coursera.org), 유다시티(udacity.com) 같은 무크(MOOC:대규모 온라인 공개 강연 플랫폼) 강의다. 해외 유명 석학들의 온라인 강의를 들으며 직접 질의응답도 하고 과제도 수행할 수 있다. 코딩, 데이터 과학, 통계분석 방법론은 물론이고 요즘 핫한 애자일 방법론, 그로스해킹, 사회관계망 분석 등 다양한 분야의 수업을 무료로 들을 수 있다. 끝까지 수행하고 나면 수료증도 나온다. 몇 년 전부터 애플·구글·페이스북을 비롯한 실리콘밸리의 기업들이 이와 같은 무크 강의 수료 여부를 취업 과정에 반영하기 시작했다. 

정부기관은 물론이고 국내 주요 대학들이 유료로 개설한 데이터 분석 코스 강의도 적지 않다. 직장에 다니며 대학이 개설한 정식 코스를 밟는 게 부담된다면, 패스트캠퍼스(fastcampus.co.kr)나 DS스쿨(dsschool.co.kr) 등 양질의 강의를 제공하는 기관들을 찾아 저녁이나 주말 시간을 활용해보는 것도 권할 만하다.

‘문송’한 필자도 이제 쭈뼛쭈뼛 코딩을 할 수 있다. 필자의 한 지인도 독학으로 데이터 분석을 배워, 국내 유수의 게임회사에 데이터 과학자로 이직했다. 늦었다고 생각했을 때는 이미 늦다. 빠르게 결심하고, 데이터와 코딩에 친숙해져보자. 너무 잘할 필요도 없다. 능숙하게 다루는 사람들과 협업하기 불편하지 않을 정도까지만 배워도 충분하다. 무엇보다 배우는 게 생각보다 어렵지 않다.

기자명 이종대 (데이터블 대표) 다른기사 보기 editor@sisain.co.kr
저작권자 © 시사IN 무단전재 및 재배포 금지
이 기사를 공유합니다