우리는 왜 인공지능을 공부해야 하는가

부산광역시 한 보건소에서 의료진이 인공지능 의료서비스를 활용해 환자의 흉부를 촬영하고 있다. *ⓒ연합뉴스*

이미 인공신경망, 머신러닝, 딥러닝 등은 시민들에게 익숙한 용어다. 다만 그 의미를 이해하기는 쉽지 않다. 인공신경망은 ‘뇌 신경세포를 모방한 컴퓨팅 시스템’이라고 한다. 혹시 뇌 신경세포의 연결 구조를 반도체 회로 따위로 빽빽이 새겨놓았다는 말일까? 딥러닝은 “입력층과 출력층 사이에 여러 개의 은닉층이 있는 깊은(deep) 인공신경망(〈인공지능 개념사전〉)”으로 정의된다. ‘입력’이나 ‘출력’ 같은 개념은 대충 알겠다. 다만 그 사이에 ‘여러 층’을 ‘은닉’했다는데, 도대체 무엇을 왜 숨겨놓았다는 것인가?

그나마 인공지능이나 딥러닝은 시도 때도 없이 뉴스에 등장하니 낯설지 않다. 그러나 이 부문과 깊은 연관이 있고, 시민들의 생활필수품인 스마트폰의 여러 기능을 작동하게 만든다는, 다음의 용어들은 어떤가. 활성화 함수, 손실함수, 경사하강법, 합성곱 신경망, 옵티마이저, 오차역전파법, 과대적합….

이 용어들은 21세기 경제·사회·문화 변동의 핵심 기술로 유력한 인공지능을 이해하는 데 필요한 개념들이다. 기술은 시대를 규정하는 중요한 요인 중 하나다. 18~19세기 산업혁명 및 노동자 계급 형성(이에 따른 도시 구조, 대중문화, 젠더 관계의 변화 등)의 계기는, 방직기 같은 ‘반복운동 기계’와 증기기관(동력)의 결합이다. 20세기의 대량생산 체제는 석유와 전기에 기반한 동력 덕분에 가능했다. 기술 변동은 개인들의 삶에도 큰 영향을 미친다. 산업혁명 이전 영국 직물산업의 주역은 숙련 수공업자들이었다. 사업체를 자율적으로 운영하며 비교적 풍족한 생활을 누렸다. 방직기에 일자리를 빼앗긴 뒤 기계들로 무장한 대공장에 저임금 분업 노동자로 고용되기 전까진 말이다.

기술 발전은 노동의 사회적 가치를 박탈하는 경향이 있다. 노동의 기능을 자동화해버리기 때문이다. 기술을 노동에 대한 자본의 계급투쟁으로 분석하는 시각도 있다. 물론 새로운 기술로 인해 일자리의 풍경이 하루아침에 바뀌지는 않는다. 자동화하기 어려운 노동 중 일부는 고임금 전문 직종으로 자신의 지위를 유지한다. 대다수 산업국가엔 고용을 보호하는 제도들이 있다. 새 기술이 새 직종과 일자리를 창출하기도 한다. 그러나 시장경제를 움직이는 가장 큰 원동력은 기업의 이윤 창출이다. 기업들은 새롭거나 더 나은 상품을 만들고 생산비용을 줄이는 데 적합한 기술(보유자)을 찾아 헤맨다. 그 과정에서 직종의 지위가 바뀌고 심지어 사라지는 과정이 서서히 혹은 급격히 진행된다. 문제는 속도와 과정이다.

인공지능은 20세기 초중반까지의 핵심 기술들과 차별성을 갖는다. 과거 기술들은 대체로 인간의 육체적 동작을 자동화하는 데 그쳤다. 인공지능은 인간만이 할 수 있다고 믿어졌던 지적 능력(인지·판단 등)을 ‘자동화’한다. 예컨대 과거엔 스승이나 선배, 동료 등으로부터 읽을 만한 책이나 볼만한 영화를 추천받았다. 지금은 인터넷 서점이나 OTT가 추천한다. 더욱이 이 추천은, 인공지능이라는 ‘예측 기계’가 인간으로선 엄두도 낼 수 없을 정도의 광범위한 현실 데이터를 바탕으로 ‘심사숙고’한 결과다.

기술은 시대를 규정하는 중요한 요소다. 산업혁명(위)은 개인의 삶에도 큰 영향을 끼쳤다. *ⓒFlickr*

인공지능의 예측 메커니즘

인간은 문제를 푸는 존재다. 매일 매 순간 부닥치는 문제에 지적 능력으로 대처하며 살아간다. 문제는, ‘오늘 점심은 무엇을 먹을까’부터 ‘엑스레이 영상을 암으로 진단할 것인가(의사)’ ‘이 사람에게 대출해도 떼먹히지 않을까(금융)’ 따위로 다양하다. 문제의 해법을 찾을 때 인간은 경험(과거의 데이터)에 의존한다.

당신이 작은 카페를 20여 년 운영해왔는데, 오는 가을에 어떤 메뉴를 내놓을지 궁리 중이라고 치자(문제). 당신은 기본적으로 경험(과거의 데이터)에 의지해서 판단한다. ‘가을엔 단호박 케이크가 많이 팔렸고, 오렌지주스의 주문은 확 줄었지.’ 이런 과거 데이터를 기반으로 ‘가을(계절)→단호박 케이크(인기 상품)’라는 ‘패턴’을 떠올린 것이다. 계절을 인간의 지적 능력에 ‘입력’하니 인기 상품이 ‘출력’되었다. 이에 따라 단호박 공급처를 미리 확보해둘 수 있다(해법).

인공지능(머신러닝) 역시 과거 데이터를 기반으로 패턴을 산출해낸다. 다만 위 사례의 카페 주인이 직관적 판단력을 발휘했다면, 인공지능은 과거 데이터로 입력과 출력 간의 관계를 설명할 수 있는 방정식(예컨대 y=ax+b 형태)을 설정한다. 그 뒤 방정식을 거듭 수정하면서 패턴을 ‘찾아나간다’.

이 카페의 매출 실적이 장부에 남아 있다면, 지난 20여 년 동안 계절별로 어떤 상품이 가장 많이 팔렸는지 데이터베이스로 정리할 수 있을 것이다. ‘2010년 가을(입력)엔 아메리카노(출력)’ ‘2017년 가을엔 단호박 케이크’ 등이다. 컴퓨터는 이런 데이터들을 연산 가능한 숫자 형태로 바꿔 삼킨 뒤 삽시간에 입력과 출력 사이의 패턴(방정식)을 산출해낸다. 카페 메뉴의 방정식(y=ax+b)이라면, x(입력)는 계절이고 y(출력)는 인기 상품에 해당한다. 컴퓨터는 x와 y를 이미 알고 있다. a와 b만 계산해내면 방정식을 완성시킬 수 있다. 이는 중학교 수학 과정인 연립방정식(y=ax+b)에서 x와 y의 좌표를 미리 알려준 뒤 a와 b를 계산하라는 문제와 비슷하다.

이 단계에서 a=0.2, b=3으로 계산되었다면 y=0.2x+3이란 방정식을 설정할 수 있다. 예컨대 이 방정식의 x에 ‘숫자로 변형된 가을’을 대입하면, 이에 0.2를 곱하고 3을 더해서 아메리카노나 단호박 케이크, 오렌지주스에 해당하는 수치를 산출한다는 이야기다.

그러나 끝나려면 멀었다. 컴퓨터는 과거 데이터를 기반으로 설정한 이 방정식에 예컨대 ‘2010년 가을’을 입력하고 ‘아메리카노(해당 시기의 실제 인기 상품)’가 출력되는지 검증해본다. 모든 데이터에 대해 같은 작업을 수행한다. ‘(1)방정식에 따른 출력’과 ‘(2)과거 시점의 실제 결과’를 비교하기 위해서다. (1)과 (2)는 숫자 형태로 환산되어 있기 때문에 그 차이를 수치로 나타낼 수 있다. 차이들의 합계도 낼 수 있다. 차이의 합계가 크다면, 해당 방정식은 과거 입출력 데이터 사이의 패턴을 제대로 반영하지 못한 엉터리다. 컴퓨터는 (1)과 (2)의 차이를 최소화하는 방향으로 방정식을 수정한다. 컴퓨터가 만든 방정식의 출력(y)을 실제 결과와 좀 더 비슷하게 만들기 위해서다. 방정식의 a와 b를 수정한다고 봐도 된다. 컴퓨터는 그 차이를 ‘더 이상 줄일 수 없다(최소화되었다)’고 스스로 판단할 때까지 이 수정 작업을 되풀이한다.

그 최종 수정본으로 산출된 ‘계절과 인기 상품 간의 패턴(방정식)’이 ‘머신러닝 모델’로 불리는 ‘예측 기계’로 활용된다. 모델의 목적은 과거 패턴의 확인이 아니다. 2022년 여름의 시점에서 미래(예컨대 같은 해 가을)의 인기 상품을 예측하는 것이다. 이렇게 패턴을 예측해서 문제를 해결해나가는 인간의 지적 능력 중 일부가 머신러닝을 통해 ‘자동화’되었다. 디지털 비서, 번역, 스팸 가려내기, 자율주행, 자연어 처리 같은 첨단기술들은 머신러닝의 이 같은 문제 풀이 능력에 기반하고 있다(다만 지금까지의 이야기는 머신러닝의 기본 메커니즘을 설명하기 위해 상황을 극단적으로 단순화한 가상 사례라는 점을 감안해주시기 바란다).

딥러닝은 머신러닝의 한 종류다. 기본적 메커니즘에선 다르지 않다. 다만 2010년대 이전의 머신러닝으로는 처리하기 힘든 데이터가 많았다. 여러 연산 방법을 결합해야 출력값을 구할 수 있거나, 영상과 음성처럼 용량이 크고, 문장처럼 복잡한(문장은 단어들의 집합인 동시에 단어의 배열 순서에 따라 전체 의미가 바뀐다) 데이터들이다. 이런 난점을 돌파하기 위해 주로 2010년대에 개발된 기법들 덕분에 컴퓨터는 이미지를 구분하고 소리를 들으며 번역까지 할 수 있게 되었다. 이 역시 머신러닝의 일종이지만, 보고 듣고 이해하는 능력으로 대중적 센세이션을 일으키면서 연구 투자와 역량을 모았다. 그러다 보니 머신러닝 부문의 새로운 기술들이 ‘딥러닝’이라는 명칭으로 따로 불리게 된 것이다.

인공지능은 인간의 문제 풀이 능력 가운데 상당 부분을 자동화하는 데 성공했다. 앞으로 수십 년 동안 글로벌 경제 변동을 주도할 것으로 기대되는 기술이다. 역동적인 자본주의 시장경제 체제에서 살아가는 개인으로서는 미래의 기회를 잡기 위해서라도 인공지능을 학습할 필요가 있다. 이른바 좋은 일자리 중의 상당수가 데이터를 처리해 분석하고 머신러닝 모델을 설계하며 여기서 발견한 패턴으로 기업이나 사회적 문제의 해법을 발견하고, 이를 실행할 로봇을 설계하는 직종에서 나올 것이다.

〈시사IN〉 인공지능 콘퍼런스 강연자들. 맨 왼쪽 위부터 김성훈· 전태균·이철희· 황성재·하용호 씨(강연자에 대한 자세한 설명은 기사 본문 참조).

인공지능을 공부해야 하는 까닭

이 부문에 직접적으로 종사할 생각이 없다고 해도 인공지능 기술이 어떻게 작동하고 인류 사회에 어떤 영향을 미칠지 이해할 필요가 있다. 인공지능은 공익적으로 잘 활용되면 지구적 문제들(기후위기, 빈부격차)의 해법을 발견해내 인류의 부와 건강, 복지를 촉진할 수 있는 기술이다. 인공지능이 자체적 욕망을 갖고 세계 정복을 도모한다는 내용의 소설이나 영화는 어디까지나 엔터테인먼트다. 인공지능은 인간이 집단적으로 생산하는 데이터를 기반으로 작동할 뿐 스스로의 욕망과 목표를 위해 행위할 수 있는 시스템이 아니기 때문이다. 인간 사회에서 횡행하는 혐오가 알고리즘을 통해 증폭될 뿐이다. 설사 인공지능의 발전으로 수많은 직종이 사라진다고 해도 시민들 간에 적절한 합의가 이뤄지고 괜찮은 정치적 리더십이 결합된다면 노동시장 역시 바람직한 형태로 진화할 수 있을 것이다. 미래 세대는 인공지능의 긍정적 발전 경로를 적극적으로 모색하는 한편, 평가하고 감시하며 윤리적·법률적 규범을 구성해나가야 한다. 인공지능 기술로 펼쳐질 기회를 잡으려 하든 이에 사회적으로 개입하고 싶든, 먼저 인공지능을 알 필요가 있다.

2022 〈시사IN〉 인공지능 콘퍼런스 https://saic.sisain.co.kr

〈시사IN〉은 2018년부터 매년 인공지능 콘퍼런스를 개최해왔다. 그동안의 주제는 ‘딥러닝’ ‘로봇’ ‘초거대 인공지능’ 등 해당 시기에 가장 첨단적 기술로 꼽히는 부문이었다. 그러나 오는 8월8일 개최하는 ‘2022 〈시사IN〉 인공지능 콘퍼런스’는 미래 세대인 학생들을 주 대상으로 인공지능에 대한 관심을 환기하고 그 진입장벽을 낮추기 위한 목적으로 기획되었다.

이를 위해 인공지능 전반의 이해에 필수 도구인 수학 부문의 이철희 고등과학원 연구원, 인공지능 기반 인공위성 영상 분석에서 글로벌 경쟁력을 획득한 SIA의 전태균 대표, 자연어 및 음성 처리 등 수많은 딥러닝 기술 개발을 주도한 김성훈 업스테이지 대표, 한국 데이터 사이언스계의 시조새로 불리는 하용호 데이터오븐 대표, 인공지능 부문에서 발명가이자 창업자·투자자로 살아왔으며 최근에는 ‘서비스 로봇’을 실현시킨 황성재 XYZ코퍼레이션 대표 등을 강연자로 초빙했다. 강연 시간이 끝난 뒤에는 학생들을 대상으로 강연자별 멘토링 시간도 준비되어 있다. 관심 있는 독자는 이 행사 홈페이지(saic.sisain.co.kr)를 방문해주시기 바란다.

기자명 이종태 선임기자 다른기사 보기 peeker@sisain.co.kr

이 기사를 공유합니다