SF 영화 〈아이언맨〉에 등장하는 억만장자 슈퍼 히어로 토니 스타크의 모델은 일론 머스크. 테슬라(글로벌 전기자동차 회사)의 최고경영자다. 미래를 내다보는 혁신적 기업가의 모델로 이만한 인물이 없다. 젊은 나이에 온라인 결제업체 페이팔을 설립해서 이베이에 무려 15억 달러에 팔아치웠다. 그가 만든 우주로켓 회사 스페이스X는 오는 2030년까지 화성에 식민지를 건설해 지구인 8만명을 이주시킬 계획이다. 테슬라는 2018년까지 운전자가 필요 없는 완전자동운행 차량(무인자동차)을 내놓겠다고 큰소리치고 있다. 이 차량의 동력은, 역시 머스크가 회장인 솔라시티의 태양열 연료로 조달될 것이다.

이러한 머스크마저 두려워하는 것이 있다. 바로 인공지능. 그는 매사추세츠 공과대학(MIT)에서 “우리는 인공지능으로 악마를 소환하고 있다”라고 연설했다. 자신의 회사인 테슬라가 최신 인공지능 기술로 완전자동운행 차 프로젝트를 추진하고 있으면서도 말이다.

인공지능은 빅데이터를 활용한 딥러닝 방식으로 인간 고유의 능력까지도 학습할 수 있다. 지난해 미국 새너제이에서 열린 엔비디아의 GTC(GPU 개발자 콘퍼런스) 행사의 한 장면.

머스크를 비롯한 많은 사람들이 인공지능을 무서워하는 까닭은 무엇일까? ‘인간만이 할 수 있는 일’을 수행하기 때문이다. 최근 들어 인공지능의 능력이 급속히 향상되고 있다는 사실이 널리 알려지면서, 기계가 인간들의 일자리를 빼앗고 나아가 지배하게 될지도 모른다는 두려움이 확산되고 있다. 과학자 프랑켄슈타인이 자신의 창조물인 ‘괴물’에게 느꼈던 바로 그 감정이다.

기계가 인간의 일을 수행할 수 있게 된 것은 어제오늘의 사건이 아니다. 인간의 일이란 대충 ‘정신노동’과 ‘몸 노동’의 결합체다. 몸으로 어떤 일을 하든 그 사람의 두뇌 속엔 그 일에 대한 많고 적은 ‘지식’이 들어 있다. 19세기 산업혁명 이전의 장인(匠人·수공업자)들은 자신의 생산품을 만드는 복잡한 공정을 머릿속에 온전히 간직하고 있었다. 그 지식을 망치·톱·끌 등 비교적 간단한 도구를 갖고 몸 노동으로 실천해서 각종 재화를 만들어냈다. 덕분에 고용되어 일하는 경우에도, 비교적 높은 임금과 작업 과정에서의 자율성을 누렸다. 그러나 방적기 등 기계가 그 수공업자들의 일을 수행할 수 있게 되면서 상황이 바뀐다. 기계는 제작 공정에 대한 장인들의 지식을 강관과 철판, 체인 내부로 흡수해버렸다. 적어도 수년 동안의 수련을 거쳐 지니게 된 장인 수공업자들의 지식(정신노동)이 무용지물로 전락한다. 몸 노동은 극히 단순한 동작으로 세분되거나 사라졌다. 산업혁명 당시 기계 파괴 운동을 주도한 사람들은, 고임금 등 비교적 좋은 대우를 받던 장인 수공업자들이었다. 이후 200여 년 동안 기계는 지속적으로 ‘인간만이 할 수 있는 일’의 영역을 좁혀왔다. 특히 20세기 후반 들어서는, 정보통신 혁명의 성과로 상당수 제조업 부문에서 무인공장이 가능할 정도로 몸 노동의 필요성이 작아졌다. 정신노동은 제조업 부문에서 설비 제어와 기획, 연구, 마케팅 등으로 살아남았다. 법률, 의료, 저널리즘, 통·번역 등 서비스업에서는 아직도 인간의 정신노동이 핵심 생산력이다.

ⓒAP Photo지난 2014년 10월9일 테슬라의 최고경영자 일론 머스크가 신차 ‘테슬라 D’를 공개하고 있다.

무규칙한 인간의 정신활동도 ‘딥러닝’ 대상

문제는, 최근 인공지능의 급속한 발전으로 기계가 인간의 정신노동까지 온전히 따라잡을 가능성이 높아지고 있다는 점이다. 물론 20세기 중반, 컴퓨터가 발명된 뒤 기계는 인간의 정신노동 중 일부를 이미 수행해왔다. 곱하기나 나누기에서 복잡한 미적분 방정식에 이르는 계산 영역에서는, 가장 성능 낮은 컴퓨터가 제일 명석한 인간과 비교할 수 없을 정도로 우월하다. 그런데 계산 등 컴퓨터가 따라잡은 인간의 정신활동에는 공통점이 있다. 언어나 공식으로 ‘표현’할 수 있다는 것이다. 규칙으로 나타낼 수 있는 정신활동이다. 이런 규칙을 기계어로 바꿔서 컴퓨터에 집어넣으면, 해당 정신노동이 자동화된다. 복잡한 정신노동은 많은 수의 규칙을 입력하면 된다. 의학이나 생물학 부문에서도 그동안 학문적으로 입증된 다수의 규칙 혹은 법칙을 소프트웨어로 만들면, 이전에는 의사나 학자가 해온 일 가운데 일부를 기계에게 맡길 수 있다.

그러나 이런 기술 발전에도 불구하고, 기계로서는 여전히 범접할 수 없는 인간 고유의 정신 기능이 남아 있었다. 규칙으로 만들 수 없는 정신활동이다.

예컨대 당신은 얼핏 얼굴만 봐도 ‘영희’와 ‘순이’를 구별할 수 있다. 그런데 이런 구별이 어떻게 가능했는지 말로 표현하기는 쉽지 않다. 물론 영희와 순이의 눈과 코, 얼굴형을 각각 세밀하게 묘사할 수 있다. 얼굴을 가려야 하는 대상이 100명이라면? 100명이 아니라 10명이라도, 각각의 생김새를 말로 설명 들은 뒤 본인들을 만나는 경우를 생각해보자. 그런데 우리 인간은 이토록 어려운 일을 학교나 회사에서 아주 쉽게 수행해낸다. 그러나 ‘어떻게 할 수 있는지’ 설명하기는 힘들다. 직장인들의 좋지 않은 버릇으로 술자리에서마저 회사 이야기를 하는 경우가 있다. 누군가 자기 실적만 챙기고 상사에게 아부하는 동료에 대해 “그 녀석, 참 잘났어!”라고 말할 수도 있다. 한국인들은 그 문장을 ‘잘생겼다’ ‘능력 있다’ 등이 아니라 ‘꼴 보기 싫다’라는 의미로 정확히 이해한다. ‘잘났다’라는 긍정적 표현이 부정적인 비아냥으로 통용되는 이유를 설득력 있게 표현하기는 어렵다. 한국 사람이라면 서울 여의도 63빌딩 꼭대기에서 여의도의 스카이라인을 감상하다가 국회 건물을 따로 지목해낼 수 있다. 스카이라인이라는 ‘전체’와 그 ‘부분’인 국회 건물을 함께 그리고 따로 인식할 수 있는 것이다.

이런 인간의 정신적 능력들은 말로 표현하기 힘들다. 당연히 규칙으로 만들어 컴퓨터에 입력하는 것도 어렵다. 인간이 아무 생각 없이 너무나 쉽게 하는 일들이 기계에게는 불가능한 작업이었던 이유다.

ⓒAP Photo2014년 5월13일 구글이 개조한 자율주행 자동차가 미국 캘리포니아 주 마운틴뷰 지역을 달리고 있다.

대다수 사람들에게 그리 어렵지 않은 일로 간주되는 자동차 운전은 어떤가? 기계가 할 수 없는 일의 연속이다. 운전자는 항상 주변 환경을 유심히 인식해야 한다. 전방의 ‘전체’ 광경을 보는 동시에, 그 광경 가운데 위치한 가로수, 전봇대, 자동차, (갑자기 차 앞으로 뛰어들지도 모르는) 보행자 등을 각각의 다른 대상으로 구별할 수 있어야 한다. 도로 특유의 소음 가운데서 다른 차량의 경적 소리를 구분해내야 한다. 버스나 보행자가 갑자기 끼어드는 돌발 상황에도 대비해야 한다. 인간에겐 비교적 단순한 정신활동인 운전에도 변수가 너무나 많아서, 정해진 규칙대로만 움직이다간 번번이 대형 사고를 유발할 것이다.

인공지능은 지난 몇 년 동안 완전자동운행 차 부문에서 엄청난 성과를 거뒀다. 구글은 이미 지난 2010년 말에 완전자동운행 차를 선보였다. 그때 벌써 일반 도로에서 운전자 없이 1000마일(약 1600㎞)을 주행했다고 한다. 6년여가 지난 현재, 훨씬 뛰어난 성능을 지녔을 것이다. 인간들에게 쉬운 일이지만 그 방법을 표현할 수 없었던, 즉 규칙으로 만들어 기계에 입력할 수 없었던 여러 정신활동을, 기계가 어느새 습득해버렸다는 이야기다. 그렇다고 해서 인간 개발자들이 ‘가로수와 보행자 구분 방법’ ‘전체 소음에서 경적 소리를 따로 인식하는 방법’ 등을 규칙으로 만들어내는 방법을 알아내 인공지능 시스템에 입력해준 것도 아니다. 어폐가 있지만, 인공지능은 스스로 그 규칙들을 터득했다.

인간이 다른 사람의 얼굴을 구별하는 능력은 따로 배운 것이 아니다. 이 세상에 태어나 수많은 경험을 통해 자기도 모르게 습득했다. 그렇다면, 기계 역시 수많은 경험(기계에겐 이미지나 음성 데이터)을 통해 그 능력들을 스스로 학습해갈 수 있지 않을까? 이 같은 아이디어 자체는 1950년대 말에 나왔다. 머신러닝(machine learning)이라고 부른다. 이후 여러 가지 통계적 방법을 적용해서 일정한 성과에 도달하기도 했다. 그러나 머신러닝이 엄청나게 도약한 것은 최근이다. ‘딥러닝(deep learning)’이라는, 아주 효율적인 기법이 개발되면서부터다.

당초 머신러닝의 여러 갈래 중 하나인 ‘인공 신경망’이 발전한 최근의 형태가 바로 딥러닝이다. 인공 신경망은, ‘기계가 인간만이 할 수 있는 정신활동을 수행하려면, 인간 두뇌를 흉내 내야 한다’라는 발상에서 출발했다.

인간의 두뇌는 아직 미지의 영역이다. 다만 1000억 개 정도의 신경세포로 이루어진, 일종의 정보처리 기계란 것은 어느 정도 인정되고 있는 듯하다. 각 신경세포는 (시각·청각·촉각 등과 관련된) 정보를 받으면(입력) 일정한 방법으로 처리한 뒤 전기화학적 신호 형태로 다른 수많은 신경세포들에게 보내는(출력) 것으로 알려져 있다. 이런 정보의 입출력을 통해 신경세포들은 복잡하게 ‘연결’되면서 신경망(신경세포 네트워크)을 이룬다.

머신러닝 연구자들은 자신들이 생각한 두뇌의 정보처리 과정을 모사해서 ‘인공 신경망’을 만들어냈다. 가상의 신경세포와 그들 사이의 연결부를 설정하는 방법으로 두뇌의 구조를 모사한 소프트웨어다. 또한 가상 신경세포들은 여러 계층으로 나뉘어 있다. 외부 정보(시각·청각·촉각 등)는 입력층의 신경세포들로 들어가서 출력층의 신경세포에서 완성된 이미지나 소리로 나타난다. 그사이에 ‘은닉층’이 있다(오른쪽 위 그림 참조).

인공지능 시스템이 어떤 물체를 볼 때, 그 대상물은 인공 신경망의 입력층에 화소(색채와 명암을 가진 극히 작은 점)의 형태로 입력된다. 입력층의 가상 신경세포들은 무수히 많은 화소의 정보를 은닉층의 가상 신경세포들로 전달한다. 은닉층 내에도 여러 계층이 있어서 신경세포들 사이의 입출력이 반복된다. 이런 과정에서 화소들은 점차 부피·음영·윤곽 등 관찰된 물체의 속성을 갖춰나간(정보처리) 끝에 출력층을 통해 총체적 형상으로 인식된다. 이런 정보처리를 담당한 곳이 은닉층이다. 은닉층 내부의 겹(계층)이 많을수록 정보처리 역시 잦아져서 외부 세계를 좀 더 정확하게 파악할 수 있도록 설계되었다.

의사 앞지른 인공지능의 ‘암 판별’ 능력

한편 인공 신경망은 학습능력을 갖고 있다. 가상 신경세포들이 어떻게 연결되어 있느냐에 따라 ‘출력 결과(외부 세계를 올바로 인식했는가?)’가 결정된다. 그리고 출력 결과가 외부의 대상을 제대로 맞혔다면, 이에 기여한 가상 신경세포의 연결부는 강화되고, 오답으로 이어진 연결부는 약해지거나 제거된다. 그만큼 인공지능은 똑똑해지는 것이다.

몇 년 전까지는 인공지능들이 가상의 신경세포를 수십~수백 개 설정하는 수준이었다. 은닉층 내의 계층도 2개 이상 만들지 못했다. 인공 신경망 내의 계층이 입·출력층을 합쳐서 4개에 불과했던 셈이다. 당시 컴퓨터 하드웨어의 연산능력은, 그 정도의 인공 신경망을 작동시키기에도 힘겨운 수준이었기 때문이다.

6월25일자 〈이코노미스트〉 인공지능 관련 특집 기사에 따르면, 그동안 컴퓨터 연산능력이 폭발적으로 발전하면서 최근에는 가상 신경세포 수십억 개를 설정할 수 있게 되었다. 더욱이 인공 신경망 내의 계층도 20~30개는 일반적일 정도로 발전했다. 심지어 마이크로소프트 연구자들은 최근 152개 계층으로 이루어진 인공 신경망을 구축하는 데 성공했다고 한다. ‘딥러닝’의 ‘딥(deep)’은 은닉층이 수많은 계층으로 이루어져 있다는 의미다.

ⓒGoogle 홈페이지‘구글 데이터센터’의 모습. 글로벌 인터넷 기업들의 서버에는 매일 천문학적인 양의 데이터가 쌓인다.

그렇다면 인공 지능망은 어떻게 학습하는가? 인간 모범생이 모의시험을 통해서 실력을 키워나가는 것과 비슷하다. 개발자들이 인공지능을 대상으로 모의시험을 실시한다. ‘사람의 얼굴을 찾으시오’라는 출제와 함께 사람·원숭이·개·고양이 등의 얼굴 이미지 수천, 수만 개를 제시하는 것이다. 인공지능은 나름의 데이터 검색과 비교 등의 과정을 통해 사람의 얼굴을 가려낸다. 맞히기도 하고 틀리기도 할 것이다. 그 결과에 따라, 앞에서 설명한 대로 가상 신경세포들 간의 연결부가 강해지거나 약해진다. 이로써 다음 시험의 정답률은 더욱 향상될 것이다. 이런 과정을 되풀이하면서 인공지능은 스스로 사람의 얼굴을 가리는 규칙을 습득하게 된다. 물론 그 규칙 자체는 인공지능은 물론 해당 개발자들도 명시적으로 표현할 수 없는 종류의 것이지만 말이다.

구글, 페이스북, 마이크로소프트, 바이두 등 글로벌 인터넷 기업의 유저들은 해당 업체의 서버에 천문학적인 수의 데이터를 매일매일 쌓아준다. 인공지능은 이런 데이터들로 계속 학습한다. 구글에서는 하루 12억 개 정도의 검색이 이루어진다. 구글은 유저의 검색어에 대해 수많은 링크를 제공한다. 그 가운데서 유저가 선택한 링크 역시 검색엔진에 중요한 학습 자료다. 이를 통해 검색엔진은, 특정 검색어에는 어떤 링크를 제공해야 정확한지 학습하며 능력을 키운다. 딥러닝에서는 인간이 소프트웨어를 만드는 것이 아니다. 데이터가 소프트웨어를 만든다.

딥러닝은 인공지능의 능력을 폭발적으로 성장시켰다. 페이스북이 2014년 발표한 ‘얼굴 인식’ 프로그램인 딥페이스는 특정인 식별에서 정답률 97%를 기록했다. 인간과 비슷한 수준이라고 한다. 인공지능이 앞뒤의 전체 광경과 그 속의 다른 자동차, 인간 등을 구분해서 인식하지 못한다면, 테슬라가 2018년까지 완전자동운행 차를 선보이겠다고 장담하긴 어려웠을 것이다. 엑스레이나 CT 스캔을 보면서 암 여부를 판단하는 능력에서 인공지능은 이미 인간 의료인을 앞지르고 있는데, 이 또한 딥러닝에 의해 이미지의 일부를 따로 관찰하는 능력을 갖추게 된 덕분이다. 이 밖에도 딥러닝은 인터넷 서비스나 모바일에서 스팸메일 차단, 번역 서비스, 음성인식 등의 개선에 크게 기여하고 있다.

인공지능이 인간 두뇌를 능가할 수 있을지, 능가한다면 그 시기가 언제쯤일지는 정확히 알 수 없다. 그러나 인공지능들은 지금도 매일 거듭되는 엄청난 양의 학습을 통해 능력을 확장하고 있으며, ‘그날’이 도둑처럼 올 수 있다는 것이 많은 전문가들의 전망이다.

기자명 이종태 기자 다른기사 보기 peeker@sisain.co.kr
저작권자 © 시사IN 무단전재 및 재배포 금지
이 기사를 공유합니다