바둑, 그 이상의 대국

커버 스토리

바둑계와 과학계가 동시에 경악했다. 구글 딥마인드의 인공지능 바둑 프로그램 ‘알파고’가 인간 프로 기사를 5-0으로 꺾고, 유력 학술지 〈네이처〉의 표지 논문으로 실리고, 한 시대를 풍미한 천재 기사 이세돌 9단에게 도전장을 던지더니, 마침내 인간 최고수를 세 판 연속으로 꺾어냈다. 이 모든 일이 반년도 안 되는 사이에 일어났다.

인류의 지적 활동이 인공지능에 추월당하는 일이 새롭지는 않다. IBM의 인공지능 체스 프로그램 ‘딥블루’가 인간 챔피언 게리 카스파로프를 꺾은 게 1997년이다. 미국의 유명한 퀴즈쇼 〈제퍼디〉에서도 역대 최강의 출연자들이 IBM이 개발한 인공지능 ‘왓슨’에 무릎을 꿇었다. 2011년의 사건이다. 그런데도 바둑은 특별한 충격을 준다. 인공지능의 도전에도 바둑만은 예외라던 확신이 부서져 나가고 있다.

인공지능이 인간보다 확실히 탁월한 영역은 연산이다. 일단 주어진 과제를 ‘연산 문제’로 바꾸는 데 성공하기만 하면, 이후로는 인간이 인공지능을 이길 방법은 없다. 인공지능 프로그램의 고전적 전략은 게임의 경우의 수를 사실상 모조리 검토해서 최선의 길을 찾아내는 ‘단순 무식한’ 방법이다. 무시무시한 연산 능력이 있기에 가능하다.

그런데 바둑은 게임의 속성상 이게 안 된다. 바둑은 장기나 체스보다 훨씬 자유도가 높아서 경우의 수가 사실상 무한대다. 그 어떤 슈퍼컴퓨터도 연산만으로 바둑을 풀어내는 것은 불가능했다. 인공지능은 바둑에서 연산의 영역에 가까운 끝내기나 근접 전투에서는 제법 괜찮은 능력을 보여주다가도, 전체 판을 읽으며 형세를 판단하고 집과 세력의 균형을 잡는 등 종합적이고 전략적 사고력을 요구하는 장면에서 번번이 한계를 드러냈다. 전체 판을 읽는 전략적 사고는 연산으로 치환할 수 없기 때문에 바둑은 인공지능이 정복할 수 없는 게임으로 여겨졌다.

그래서 인공지능이 바둑마저 정복하기 직전이라는 소식이 들려왔을 때 바둑의 속성을 아는 사람들이 느낀 공포감은 이런 것이었다. ‘바둑은 경우의 수가 무한대이므로 연산만으로 극복할 수 없는 게임이다. 그렇다면 인공지능이 연산을 넘어 감각이나 추론과 같은 더 고차원적인 지적 영역까지 도달했다는 뜻이 아닐까.’ 만일 그렇다면 우리는 2016년을 인공지능의 새로운 원년으로 불러야 할 수도 있다. 진실은 어떨까. 알파고의 구동 원리를 따라가 보자.

알파고는 인공지능의 세계에서 각광받는 무기 ‘머신러닝(Machine Learning)’, 그중에서도 ‘딥러닝(Deep Learning)’을 장착했다. 인공지능이 스스로 학습한다는 의미다. 알파고가 던지는 충격파를 이해하려면 이 ‘학습’의 의미를 이해해야 한다.

아주대 감동근 교수(전자공학)는 IBM에서 퀴즈풀이 인공지능 ‘왓슨 프로젝트’에 참여했던 연구자인 동시에 한국기원 공인 아마 5단이다. 인공지능과 바둑을 둘 다 이해하는 보기 드문 연구자다. 그는 우선 간단한 그림으로 기계학습에 대한 우리의 이해를 돕는다. 위 〈그림 1〉은 유명한 파블로프의 조건반사 실험을 신경망으로 묘사한 것이다. “원래 개는 음식을 봐야 침을 흘린다. 뉴런(뇌 신경세포)1이 시각 신호에 의해 활성화되면, 그 신호가 시냅스(뉴런의 연결망)1을 통해 뉴런3에 전달되고, 그 결과 침 분비 신호가 근육으로 보내진다. 그런데 개에게 음식을 줄 때마다 종소리를 들려주면, 뉴런1이 활성화될 때마다 뉴런2도 활성화되고, 그 결과 시냅스2가 강화된다. 나중에는 음식 없이 종소리만 들려줘도 뉴런2의 활성 상태가 시냅스2를 통해 뉴런3에 전달되어 침이 분비된다.”

이 설명은 직관적인 이해를 위해 도식화한 것이지만, 핵심은 ‘시냅스2가 강화된다’는 대목이다. 세계적인 뇌과학자 승현준 MIT 교수는 책 〈커넥톰, 뇌의 지도〉에서, 뇌의 신경망은 정보처리를 거듭하면서 연결이 강해지거나 약해지고 심지어 없던 연결이 생기는 등 끊임없이 변화한다고 설명한다. 이런 원리를 컴퓨터 프로그램에 적용하면 어떻게 될까?

파블로프의 조건반사 실험을 신경망으로 묘사한 그림. 여기에서 핵심은 ‘시냅스2가 강화된다’는 대목이다.

인간과 고양이를 구분하는 인공지능의 개념도. 입력층과 출력층 사이 은닉층이 여러 층 있다.

극단적으로 단순화해서 알파고가 〈그림 1〉과 같은 단순 구조로 되어 있다고 해보자. 현재 알파고는 ‘상대의 말을 잡으러 가는 수 A’와 ‘차분히 집을 버는 수 B’ 중에서 고르는 상황에 처해 있다. 그런데 뉴런1이 처리한 정보는 ‘수 A’를 추천하고 뉴런2가 처리한 정보는 ‘수 B’를 추천했다. 뉴런3은 ‘수 A’를 택했다. 그리고 공격에 실패하고 형세를 망쳐 바둑에 졌다.

이제 알파고는, 비유하자면 뉴런1을 이전보다 불신하게 된다. 이때 알파고의 대응은 시냅스1의 ‘가중치’를 떨어뜨려, 뉴런1로부터 오는 신호를 받을 확률을 낮추는 것이다. “이런 장면에서는 대마를 잡으러 가서는 안 된다”라는 정보는 이런 방식으로 ‘학습’된다. 인공지능은 주어진 과제를 수행해보고 결과에 따라 연결망의 가중치를 조정하는 식으로 학습을 한다. 가중치란 ‘누구 말을 더 신뢰할 것인가’에 대한 인공지능의 판단이고, 이 판단이란 과제 수행의 결과 데이터에서 나온다. 인공지능의 학습이란 ‘시행착오를 통한 연결망의 가중치 조절’인 셈이다.

인공지능 연구자 마쓰오 유타카 교수(도쿄대 대학원)는 이런 식의 학습 원리를 회사 조직에 비유하기도 했다. 신입사원 두 명이 입사를 했다. 관리자인 당신은 두 사람에 대해 아는 바가 없으므로 둘을 똑같이 신뢰한다(초기 설정). 그런데 일을 여러 번 시켜보니(데이터 입력) 신입 A가 신입 B보다 일을 못한다(시행착오). 이제 관리자는 B의 보고서를 더 신뢰하고 A의 보고서는 더 의심한다(가중치 조절). 이런 가중치 조절을 여러 차례 거치면, 그 조직이 올바른 판단을 할 가능성이 올라간다(학습).

인공지능 능력이 일취월장한 ‘딥러닝의 시대’

신경망 네트워크 형태로 설계된 인공지능은 정보가 들어가는 ‘입력층’과 결과값을 내는 ‘출력층’, 그리고 둘 사이에서 정보를 처리하는 ‘은닉층’으로 구성된다. 인공지능이 처리해야 하는 작업이 복잡할수록 은닉층 한 층으로는 부족한 상황이 생긴다. 그래서 은닉층을 여러 층 쓰게 된다. 은닉층이 두 층 이상인 기계학습 인공지능을 ‘딥러닝’이라고 부른다. 왼쪽 〈그림 2〉는 구글이 공개한, 인간과 고양이를 구분하는 인공지능의 개념도다. 입력층과 출력층 사이 은닉층이 다수 있는 것을 볼 수 있다.

*ⓒAP Photo*1997년 5월 인간 챔피언 게리 카스파로프가 IBM의 인공지능 체스 프로그램 ‘딥블루’와의 체스 대결에서 패배했다.

이 아이디어 자체는 아주 단순해서 1970년대부터 알려져 있었다. 하지만 두 가지가 발목을 잡았다. 첫째, 은닉층이 늘수록 연결망은 몇 배로 복잡해지기 때문에 아주 강력한 연산능력이 필요했다. 둘째, 연결망이 복잡해지면 학습에 필요한 데이터의 양도 크게 늘어난다. ‘시행착오를 통한 가중치 조정’으로 올바른 결과에 도달하려면 시행착오가 많을수록 좋은데, 은닉층이 늘수록 더 많은 데이터가 필요해지는 것이다. 2010년대 들어서 컴퓨터 기술의 발전과 빅데이터 시대의 개막으로 이 두 가지 문제의 실마리가 풀렸다.

딥러닝에 대해서는 인공지능 연구의 중요한 도약이자 새로운 경지라는 낙관론과, 컴퓨터 발달과 빅데이터 시대의 도움을 받은 것일 뿐 개념 자체는 머신러닝의 단순한 확장에 가깝다는 신중론이 공존한다. 딥러닝 개념으로 설계된 인공지능 안에서 정확히 무슨 일이 일어나고 있는지 설계자 자신도 이해하지 못한다는 한계도 있다. 어쨌든 딥러닝 시대가 열린 이후 여러 영역에서 인공지능의 능력이 눈에 뜨이는 상승을 보인 것만은 사실이다. 알파고도 그중 하나다.

알파고는 은닉층을 13개나 집어넣었다. 바둑은 수읽기, 집계산, 형세 판단, 전략 선택 등 아주 층위가 다양한 의사 결정을 동시에 해내야 하는 게임이다. 인공지능이 다양한 변수를 동시에 다룰 능력이 있어야 하는데, 컴퓨터의 능력과 데이터의 크기가 충분하기만 하다면 많은 은닉층이 도움이 된다.

학습 능력이 바둑 인공지능의 돌파구가 되었다는 말을 들으면 우리는 마치 인간이 바둑을 배우는 것과 같은 학습을 연상하게 된다. 인간은 바둑을 배울 때 단순한 연산 능력 경쟁에서 출발하여, 두터움에 대한 감각에 눈을 뜨고, 전체 판을 조망하는 전략적 판단의 가치를 알아가는 식으로 바둑에 대한 이해를 확장해 나간다. 그런데 인공지능은 정반대다. 알파고는 바둑의 다양한 층위, 고도의 인지 능력, 감각, 전략적 사고가 필요한 과제를 연산 문제로 치환한다. 즉, 인공지능은 바둑의 세계를 연산 문제로 좁힐수록 실력이 는다.

다시 감동근 교수의 설명을 들어보자. 알파고의 ‘세계를 좁히는 학습’은 이렇게 진행된다. 알파고는 온라인 바둑 사이트 KGS에 올라온 기보(바둑 한 판의 수순을 첫수부터 마지막 수까지 기록한 자료) 16만 건을 학습했다. 바둑 한 판에서 대략 200수 안팎의 데이터를 뽑을 수 있으므로 약 3000만 수를 학습한 셈이다.

알파고의 신경망은 초기 상태에서 무작위로 설정한 가중치를 갖고 있다. 여기에 기보를 집어넣고 알파고에게 다음 수를 예측하는 과제를 준다. 인간이 둔 결과물인 기보의 다음 수를 맞히면 성공, 알파고가 다른 수를 두면 실패로 보고 신경망의 가중치를 조정해 나간다. 이 과정이 끝나면 꽤 그럴듯한 수를 두는 인공지능 알파고가 되어 있다. 이제는 알파고가 자기들끼리 대국을 할 수 있다. 신경망 가중치를 임의로 약간 조정한 ‘알파고 2’를 ‘알파고 1’과 맞붙인다. 그렇게 해서 더 많이 이기는 쪽의 가중치를 채택하는 방식으로 인공지능의 목표 수행 능력을 끌어올린다. 이 과정도 수없이 반복할 수 있다. 이 모든 과정에서 알파고가 바둑의 원리나 전략을 이해할 필요는 없다.

*ⓒIBM 제공*2011년에는 IBM의 인공지능 ‘왓슨’(아래 사진 가운데)이 역대 최강의 퀴즈쇼 우승자들을 제쳤다.

심지어는 바둑에서 가장 까다로운 능력 중 하나인 ‘형세 판단’도 이 같은 방식으로 훈련시킬 수 있다. 바둑을 두다 보면 세력·두터움·발전성 등 미래에 유용하지만 당장은 명확하지 않은 가치를 평가해야 할 일이 생긴다. 특정한 모양에 대해 서로 다른 평가함수를 설정한 ‘알파고 1’과 ‘알파고 2’를 대국시키면 어떤 평가함수가 더 우세한지를 알 수 있다. 알파고는 ‘형세’를 이해하지도 못하고 의식적으로 ‘판단’을 내리지도 않는다. 하지만 인공지능이 과제를 수행하는 동안 ‘형세 판단처럼 보이는 그 무엇’에 가까워진다.

‘심오한 그 무엇’을 연산으로 치환해내는 방법

알파고는 ‘인공지능이 감각이나 추론과 같은 더 고차원적인 지적 영역까지 도달하지 않았을까’ 하는 공포를 가져다주었다. 그러나 알파고는 자신이 선택한 수가 왜 좋은 수인지를 이해하지도 설명하지도 못한다. 기계 학습이란 우리가 아는 학습이 아니다. 알파고는 인간이 ‘바둑의 심오한 그 무엇’이라고 믿는 경지를 최초로 이해한, 우리가 본 적이 없었던 한 단계 높은 지능체가 아니었다. 이것은 차라리 ‘심오한 그 무엇’을 연산으로 치환해내는 방법을 찾아내는 데 성공한 영리한 엔지니어의 승리다.

뇌과학자 정재승 교수(카이스트)는 〈시사IN〉과 인터뷰(18~19쪽 기사)하면서 이런 말을 했다. “인공지능이 이해할 수 있는 방식으로 정의 가능한 과제라면, 그게 무엇이든 인공지능이 인간을 추월할 것이다.” 이 말은 두 가지 함의를 갖고 있다. 첫째, 미래 세계에서 우리는 인공지능이 해낼 수 없는 일, 연산의 형태로 과제를 정의할 수 없는 일에 종사하는 것이 유리하다. 그래야만 인공지능과의 가망 없는 경쟁에 빨려 들어가지 않을 수 있다. 둘째, 우리가 연산의 형태로 정의가 불가능하다고 믿는 많은 일들이, 실제로는 가능할 수 있다. 구글 딥마인드가 바둑의 ‘심오한 그 무엇’을 연산으로 번역해내는 데 성공한 것은 그래서 의미심장하다.

세계적인 금융투자 기업 골드먼삭스는 금융분석 인공지능 프로그램 ‘켄쇼’를 도입해 놀라운 성과를 보고 있다. 연봉 50만 달러 애널리스트의 40시간 작업량을 켄쇼가 몇 분 내로 처리해버리는 바람에 골드먼삭스에 해고의 칼바람이 몰아칠 전망이라고 2월27일자 〈뉴욕 타임스〉가 보도했다. 아이디어와 기술과 데이터와 시장성이 뒷받침된다면, 인간만이 가능하다고 생각했던 일 중 여럿은 의외로 빨리 연산 형태로 해체될 수 있다. 그렇게 되면 우리는 인공지능이 추론과 추상적 사고 능력을 갖추는 고도화 단계 이전에도 충분히 벅찬 경쟁에 직면해야 한다. 나무판에 돌을 늘어놓는 2500년 된 고전 게임이 3월9일부터 보여줄 풍경의 진짜 의미다.

*ⓒ시사IN 신선영*2월22일 이세돌 9단(왼쪽)과 인공지능 바둑 프로그램 알파고를 개발한 구글 딥마인드 CEO 데미스 하사비스가 서울과 런던을 화상으로 연결하는 방식으로 대국 관련 공식 기자회견을 했다.

기자명 천관율 기자 다른기사 보기 yul@sisain.co.kr

이 기사를 공유합니다