소설 〈프랑켄슈타인〉의 주인공 빅터 프랑켄슈타인 박사가 만든 ‘괴물’이 처음으로 읽은 책은 〈젊은 베르테르의 슬픔〉 〈플루타르코스 영웅전〉 〈실락원〉이었다. 괴물은 베르테르로부터 ‘다른 대상을 향한 고결한 감정’을, 플루타르코스에게서 ‘많은 사람이 모여 사는 도시’ ‘지배와 법’ 등의 개념을 배웠다. 〈실락원〉에선 ‘하느님’과 ‘세계의 질서’를 학습했다. 글을 통해 인간의 감정과 행위를 이해하게 되면서 괴물은 점점 인간적 존재가 되어갔다. 절망과 고독에 빠져 창조자(프랑켄슈타인 박사)의 지인들을 하나씩 살해한 괴물의 복수야말로 인간이나 저지를 만한 짓이 아닌가.

ⓒAP Photo소설 〈프랑켄슈타인〉의 주인공 프랑켄슈타인 박사가 만든 ‘괴물’은 글을 읽고
인간의 감정과 행위를 학습해 프랑켄슈타인에게 복수한다.
위는 영화 〈프랑켄슈타인〉의 한 장면.

지금 세계의 거의 모든 정보는 글로 표현되어 있다. 기계가 글을 읽고 이해하게 된다면(독해할 수 있다면), 인간의 지식 세계를 섭렵할 수 있을 것이다. 프랑켄슈타인의 괴물과 달리 제대로 통제되는 ‘독해하는 기계’는 인류 사회의 편익을 고도로 높이게 될지도 모른다. 그러나 ‘기계독해(machine reading)’를 현실에 구현하는 것은 결코 쉬운 일이 아니다. 프랑스 최대 인공지능 연구소인 ‘네이버랩스유럽’(모기업 네이버)에서 ‘기계독해 기술’ 개발을 선도 중인 쥘리앵 페레즈 연구원이 몇 년째 고심하고 있는 이유다. 

컴퓨터는 글자 하나하나를 ‘일련의 숫자(벡터)’로 인식하고 처리한다. 그렇다면 의외로 기계독해는 쉬운 작업일 수 있겠다. 글자가 모이면 단어가 된다. 그 단어들을 일정한 규칙(문법)에 따라 배열한 것이 문장이다. 여러 문장을 적절히 배치해서 현상을 묘사하거나 사상을 표현하면 글이 된다. 컴퓨터가 글자와 단어, 문장 등을 숫자 형태로 인식·처리한다면, 이런 ‘재료’들을 결합하는 규칙(문법)을 제공하는 것으로 컴퓨터의 독해를 가능하게 만들 수 있지 않을까? 페레즈 연구원은 “실제로 예전에는 인간이 컴퓨터에 ‘글을 읽을 수 있는 알고리즘’을 만들어 입력시키는 방법으로 기계독해를 추진했다”라고 말했다.

알고리즘은 규칙의 다발이다. 문제 해결 방법을 순서에 따라 늘어놓는다. 예컨대 ‘방문 열기’라는 문제에는 다음과 같은 알고리즘이 필요하다. ① 방 앞으로 간다. ② 문고리를 잡는다. ③ 문고리를 틀고 잡아당긴다. ④ 방 안으로 들어간다. ⑤ 문을 닫는다.

사람은 무의식적으로 하는 일이다. 그러나 로봇에게 같은 일을 시키려면, ①~⑤의 알고리즘을 차례대로 수행하도록 프로그램을 짜야 한다. 과거에는 기계독해 역시, 프로그래머가 독해에 필요한 수많은 규칙을 작성해서 컴퓨터에 주입하는 방식으로 이루어졌다.

여기에는 뚜렷한 한계가 있다. 수많은 규칙을 일일이 입력하는 것도 보통 어려운 일이 아니지만 이보다 더 골치 아픈 문제가 있다. 언어란 본질적으로 앞뒤가 딱 맞아떨어지는 영역이 아니다. 문법을 벗어난 표현이 일상적으로 사용되는가 하면, 단어 역시 문맥에 따라 다른 의미로 나타나는 경우가 많다. 엄밀한 규칙을 수없이 정해준다고 컴퓨터가 글을 정확히 독해할 수 있는 것은 아니다.

ⓒ시사IN 조남진프랑스 인공지능 연구소 네이버랩스유럽에서 ‘기계독해 기술’ 개발을 하는 쥘리앵 페레즈 연구원.

2010년대 들어 기계독해는 머신러닝의 발전에 따라 조금 다른 길을 걷게 된다(〈시사IN〉 제569호 딥러닝 구루가 말하는 인공지능의 실체 기사 참조). 글을 읽고 이해하는 규칙을, 외부에서 인간이 주입해주는 것이 아니라 기계 스스로 익히게 하는 방법이다. 페레즈 연구원에 따르면 어린이 책읽기 교육과 비슷하다. “(머신러닝을 응용한 기계독해는) 어린이들에게 독해 공부를 시키는 경우와 흡사하다. 어린이들에겐 우선 글을 읽게 한 다음 그 내용을 충분히 이해했는지 질문한다. 제대로 답변하면, 그 글을 이해한 것으로 간주한다. 기계에게도 글을 읽힌 뒤 질문을 퍼붓는 방식으로 훈련한다.”

인공지능의 독해력이 인간보다 뛰어나다?

이런 질문들에는 당연히 정답이 달려 있다. 기계는 적절한 답변을 하거나 어처구니없는 오답을 내면서 ‘연산’ 방법을 수정해나간다. 이런 과정을 수없이 반복하는 가운데 기계 역시 ‘정답을 선택하는 규칙’을 스스로 익히게 된다는 것이, 머신러닝을 활용한 기계독해의 원리다. 전형적 지도학습이다.

글로벌 테크 자이언트들은 기계에 독해를 훈련시킬 목적으로 나름의 ‘질문-응답 자료집(question-answering dataset)’을 만들었다. 마이크로소프트 사의 MCTest (Machine Comprehension Test), 페이스북 인공지능연구소의 CBT(Children’s Book Test), 스탠퍼드 대학의 SQuAD (The Stanford Question Answering Dataset) 등이다. 보통 수백 개의 글과 그 내용에 관련된, 많게는 수십만 쌍에 이르는 질문과 응답으로 구성된다. 최근 자주 열리는 ‘인공지능 독해력 대회’에서는, SQuAD나 CBT 등 질문-응답 자료집으로 인공지능에게 수많은 질문을 한 뒤 정답률에 따라 우열을 따진다.

현시점에서 기계독해는 어느 수준까지 발전해 있을까? 언론 보도에 따르면, 인간을 이미 추월한 것처럼 보인다. ‘인공지능 독해력 대회’ 결과를 소개하면서, ‘○○사의 인공지능이 인간보다 독해력이 뛰어났다’ 같은 표현이 사용된다.

그러나 페레즈 연구원은 지금의 기계독해에 대해 매우 낮은 점수를 매겼다. “아직 지각(perception) 수준에 지나지 않는다.” ‘읽고 이해’한다기보다 ‘감각적으로’ 대상을 알아보는 정도라는 이야기다. 그의 다른 인터뷰에 따르면, 지금의 기계독해는 “글을 분석하고 범주화해서 정보의 조각들을 뽑아내는 데” 능할 뿐이다. 인터넷 검색엔진과 크게 다르지 않다. “현재의 기계독해 시스템은 글을 접하며 ‘의미 있는 단어들’을 곳곳에서 발견한다. 예를 들어 글에서 club(골프채)과 tee(골프공을 얹는 대)를 발견하면, 다음과 같이 계산한다. ‘club에 tee가 있다면 골프네!’ 이 정도의 능력이라면 ‘독해(reading)’보다는 ‘탐지(detection)’라고 부르는 것이 적당하다.”

예컨대 컴퓨터에게 ‘위키피디아’ 한국어판의 이순신 항목을 읽힌 뒤 ‘이순신의 자는 무엇인가’ ‘이순신이 무과에 급제한 것은 몇 살 때였나’라고 질문하면, 각각 ‘여해(汝諧)’와 ‘32세’라고 정확히 답변할 수 있다. 그러나 ‘이순신이 성웅(聖雄)으로 불리는 이유’를 물어보면 정확한 대답을 기대하기 어렵다. 컴퓨터는 ‘싸움에서 한 번도 패한 적이 없다’는 게 인류 전쟁사에서 대단히 희귀한 사례라는 상식을 알지 못한다. 큰 공을 세우고도 국가로부터 처절하게 버림받은 무장이 패배가 확실한 싸움(명량해전)에 다시 목숨을 걸었던 행위로부터 평균적 한국인들이 느끼는 감정을 추측하기도 힘들다. 기계는 문장 여기저기의 정보를 ‘지각’할 뿐 글 전체를 종합적으로 읽지 못한다.

쥘리앵 페레즈 같은 기계독해 연구자들은 기계가 “텍스트 전체를 종합적으로 흡수한 뒤 마치 인간처럼 질문에 답할 수 있기를 바란다”. 하지만 그 바람이 현재로서는 장기적 목표에 불과하다는 것을 안다. 아직까지는 컴퓨터에 상식과 추론(reasoning) 능력을 부여하는 방법을 확실히 파악하지 못했기 때문이다.

예컨대 ‘갑돌이가 절벽에서 떨어졌다’라는 문장을 생각해보자. 사람이 이 문장을 읽는다면, 갑돌이가 크게 다치거나 사망했을 거라고 자연스럽게 ‘추론’하게 된다. 컴퓨터는 절벽에서 떨어진 이후의 갑돌이에 대해서는 관심을 가질 수 없게 설계되어 있다. 다음 문장에서 ‘갑돌이가 올림픽 육상경기에서 우승했다’라는 내용이 나와도 예사롭게 넘길 것이다. 높은 곳에서 떨어진 사람이 ‘어떻게 된다’라는 상식을 갖지 못했기 때문이다.

추론할 수 없다면, 복수의 문장에 담긴 정보를 종합해서 문맥과 행간을 파악하기도 힘들다. 다음 같은 구절이 있다고 가정해보자. “영호는 방에 들어갔다. 그는 침대에 누워 스마트폰을 열었다. 영호는 영희의 문자가 들어왔다는 ‘알림’을 보고 깜짝 놀랐다.”

ⓒAP Photo2017년 6월8일 중국 상하이 CES 전자쇼에서는 센서를 사용해 미로를 찾아 나가는 로봇을 선보였다.

컴퓨터는 각 문장 단위로는 주요 단어와 그 의미를 곧잘 파악한다. ‘영호는 어디 들어갔나?(정답:방)’ ‘영호는 왜 놀랐나? (정답:영희의 문자)’ 같은 질문에 능숙하게 답변할 수 있다. 그러나 두 번째 문장의 ‘그’가 ‘영호’라는 사실을 인식하려면 추론 능력이 필요하다. 사람은 위의 구절을 읽고 영호와 영희의 ‘특수 관계’를 추론할 텐데, 컴퓨터에겐 어려운 일이다. 페레즈 연구원은 “컴퓨터가 독해 테스트의 일부 질문에 제대로 대답한다고 ‘기계가 이해했다’고 말할 수는 없다. 글에 담긴 두세 가지 내용을 종합해야 답변 가능한, 추론이 필요한 질문엔 제대로 응답하지 못하기 때문이다”라고 말했다. 

기계독해를 추론 단계로까지 발전시키려면 무엇을 해야 할까? 페레즈 연구원은 새로운 알고리즘을 만들어야 한다고 설명했다. 다만 자신이 나서서 컴퓨터가 글을 독해하기 위해 수행해야 할 규칙들(머신러닝 이전의 알고리즘)을 더욱 정밀하게 많이 만들어 주입하겠다는 것이 아니다. ‘좋은 질문’을 던져 컴퓨터가 ‘추론의 규칙’을 스스로 익힐 수 있는 알고리즘을 개발해야 한다는 의미다. ‘영호 이야기’의 경우, 컴퓨터에게 ‘스마트폰을 켠 사람은 누군가’라고 질문해서 ‘그가 누구인지’를 추론하게 만들어야 한다.

인간은 일상적이고 무의식적으로, 자기도 모르게 추론한다. ‘연역’과 ‘귀납’이 대표적이다. 예컨대 인간은 ‘모든 사람은 죽는다’라는 원리를 알고 있으며 이로부터 ‘지금 함께 식사 중인 친구 ○○도 언젠가 세상을 떠날 것’이라고 추론한다(연역). 혹은 반대로 역사적 인물들이 어김없이 죽었다는 것과 최근 조부모의 별세 같은 수많은 경험으로부터 ‘사람은 결국 죽는다’라는 원리를 얻는다(귀납).

컴퓨터에게 ‘모든 사람은 죽는다. 철수는 사람이다’는 글을 제시하고 ‘철수 역시 언젠가 죽는다’는 답변을 유도해낸다면, 그 기계가 ‘연역 추론’에 성공했다고 추정할 수 있다. 만약 컴퓨터가 ‘소크라테스는 죽었다. 공자는 죽었다. 정약용은 죽었다’를 읽고 ‘모든 사람은 죽는다’고 응답한다면, 기계의 ‘귀납 추론’을 입증해낸 성과라고 할 수 있을 것이다. 페레즈 연구원은 컴퓨터로부터 추론 능력을 유도하는 알고리즘에 몰두하고 있다. 그는 “질문에 대답하려면 글에서 추론해야 하는 상황으로 컴퓨터를 몰아넣어야 한다”라고 강조했다.

컴퓨터의 극복 난제 ‘집중력’과 ‘기억력’

이와 함께 컴퓨터의 ‘사고방식’을 이해할 필요가 있다. 머신러닝의 경우, 기계는 스스로 규칙을 익히는 과정에서 엄청나게 많은 ‘일련의 숫자’를 생성시키고 처리한다. 그런데 그 머신러닝을 지도하는 사람마저 그 ‘일련의 숫자’가 무엇을 가리키는지 알지 못한다. 결과를 확인할 수 있을 뿐이다. 페레즈 연구원은 “컴퓨터가 글을 읽고 어떤 답변을 했을 때 ‘왜 그랬는지’ 알 수 있다면, 더 정확한 기계독해를 발전시키는 데 도움이 되겠지만, 아직까지 쉽지 않은 일”이라고 말했다. 이는 수많은 컴퓨터 과학자들이 몰두 중인 과제다.

컴퓨터가 인간처럼 독해하려면 반드시 극복해야 하는 또 다른 난제들이 있다. 바로 집중력(attention)과 기억력(memory)이다. 사람은 글을 읽을 때 본능적으로 ‘핵심 부분’에 집중한다. 이후 어떤 문제를 해결해야 하는 상황이 되면, 과거의 경험에서 가장 적절한 정보를 기억해내 의사 결정 과정에 응용한다. 페레즈 연구원에 따르면, 지금 인공신경망(인간의 두뇌를 모방한 컴퓨터 신경망)의 집중력과 기억력은 형편없는 수준이다.

“의사 결정에는 기억이 필요하다. 당신이 큰 저택에 들어가서 부엌을 찾아야 한다고 치자. 한동안 헤맬 수 있겠지만 결국 부엌으로 가게 될 것이다. 이미 들어가 봤지만 부엌이 아닌 곳을 ‘기억’하기 때문이다. 그러나 인공신경망이라면 기억을 하지 못하기 때문에 쉽게 부엌을 찾지 못할 것이다. 독해에서도 마찬가지다. 인공신경망이 글을 접하는 경우, 일단 읽고 분석하고 나면 그것으로 끝이다. 그 순간만 이해하고 판단하지 이전의 (독서) 경험을 저장하지 못한다. 추론이 필요한 질문에 답하려면 ‘기억’할 수 있어야 한다. 물론 모든 것을 기억할 필요는 없다. 그러나 (집중력을 발휘해서) ‘중요한 부분’을 기억했다가, 어떤 질문을 받았을 때 그 저장고에서 빼내 답할 수 있으면 그만이다. 집중력과 기억력이 있어야 기계도 추론하고 이해할 수 있다.”

쥘리앵 페레즈 연구원은 ‘이해(under-standing)’를 “검색엔진처럼 정보의 조각을 탐지하는 것”이 아니라 “적극적으로 대상의 의미를 장악하는 것(actually grasping meaning)”이라고 정의한다. 이를 위해 “기억력과 집중력을 크게 강화한 기계독해 모델을 개발하는 것이 당면한 목표다”라고 말했다.

 

 

기자명 그르노블·이종태 기자 다른기사 보기 peeker@sisain.co.kr
저작권자 © 시사IN 무단전재 및 재배포 금지
이 기사를 공유합니다
관련 기사