예년보다 이르게 벚꽃이 찾아왔지만, 꽃구경은커녕 밤낮으로 방에 틀어박혀 일만 했다. 회사 임원으로 있는 친구가 연락해 일거리를 주었는데, ‘인공지능(AI) 학습을 위한 한국어 대화 요약작업’이었다.
개인 정보를 숨긴 카톡 대화를 한 문장으로 요약해 원본과 함께 AI에 넣어주면 이 녀석이 그것을 스스로 익힌 다음에 나중에 어떤 내용을 받으면 요약문을 척척 만들어낸다고 한다.
내 역할은 작업자들이 만든 요약문에 어떤 오류 경향이 있는지 분석하고 정리해 제안하는 ‘전문가 감수’였다. 감수를 제대로 하려면 요약작업도 직접 해봐야 할 것 같아 나도 1000개의 요약문을 만들어봤고, 7000개 정도의 요약문을 검토했다.
생활 속 카톡 대화의 깊이나 주제는 뻔하지만, 남들 대화를 합법적으로 보는 것은 색다른 재미가 있었다. 읽고 요약하는 것이야 본업에 가까운 일이니 어려울 것 없이 시간만 투자하면 될 일이었다. 그래서 나는 아내에게 ‘디지털 시대의 인형 눈알 붙이기’라고 소개했다.
아내는 일이 재미있어 보였는지 처음에는 조금씩 참견하다가 한 번만 하게 해달라고 졸랐다. 건당 몇백 원씩 받는 일을 잠깐 넘겨주고 커피를 얻어 마셨으니, 마치 『톰 소여의 모험』에서 벌로 담장을 칠하던 톰이 순진한 친구 앞에서 화가라도 된 듯 무게 잡아 일을 떠넘기고 사과를 받아먹은 것과 같았다.
그런데 반복적인 작업이 그렇듯이 처음에는 재미있지만 열 개와 백 개가 다르고, 백 개와 이백 개는 정말 다르며, 반환점 전부터 진이 빠진다. 한참 한 것 같아도 제자리이고 능률은 점점 떨어진다.
그럴 수밖에 없는 게, 일단 카톡에서 보이는 요즘 세대의 화법을 따라잡기 힘들고, 알 수 없는 말이 너무 많았다. 나도 자녀들을 통해 생파(생일 파티), 문상(문화상품권), 댕댕이(강아지), 자만추(자연스러운 만남 추구) 같은 말은 조금 알지만, 마통(마이너스 통장), 어좁(좁은 어깨), 현웃(카톡을 보며 실제로 웃음)처럼 줄임말은 끝없이 만들어지고 있었다.
문감콘(김문정 감독 콘서트), 롤드컵(리그오브레전드 월드챔피언십) 같은 그 세대 특유의 문화적 아이콘은 검색해보지 않으면 알기 어려웠고, ㅁㅊ(미친), ㄱㅊ(괜찮아), ㅇㅈ(인정한다), ㅇㅅㅇ(할 말 없을 때의 표정) 같은 것도 다양했으며, 끝까지 파악할 수 없는 말도 많았다.
그런데 새로운 말을 알게 되는 과정은 힘들었어도 언론 등을 통해 ‘~다더라’로만 전해 듣던 20~30대들의 세계와 그들이 맞닥뜨리고 있는 현실이 어떤 것인지 조금이나마 엿볼 수 있었다.
저마다 크고 깊은 생각과 인생 계획이 있겠지만 일단 카톡을 통해 오가는 일상의 주제는 알바, 게임, 스마트폰, 먹는 것, 야근, 갑질, 택배, 연애, 온라인 쇼핑 같은 것이었다. 특히 일터에서 접하는 갑질 문화와 꼰대 현상에 대해 그들 관점에서 실감해보았으며, 장난스러운 말투, 은어, 비속어 속에서 아직 자리 잡지 못한 세대의 불안감도 감지했다.
이번 작업의 또 다른 의미는 몸이 점점 잊어가던 ‘노동의 고단함’을 느껴본 것이다. 다른 사람들은 젊은 층의 언어를 잘 이해해 그런지 작업을 빨리 끝내는 것 같았지만 나는 2016년 퇴직 이후 일하는 근육이 많이 녹아내려 30분 집중하면 신경이 분산되고 한 시간이면 눈이 침침하고 몸이 쑤셔서 쉬어야 했다. 머리를 계속 써야 하는 작업이라 더 그렇다.
대화 속 정보만을 토대로 핵심을 요약하면 되지만 모든 문장에 성의를 다하는 습성 때문에 속뜻이 보이는데도 모른 척하며 육하원칙에 따라 무미건조한 한 줄 문장으로, 말하자면 AI가 먹을 수 있는 사료 형태로 만드는 일은 낯설었다. 덕분에 AI의 관점에서 생각하고 표현하며 내 문장습관을 되돌아보는 기회가 되기도 했다.
이걸 해보니 다른 일을 할 수 없었고, 다른 일을 하다 보면 작업 진도를 나갈 수 없었다. 밥 먹거나 커피 마시러 나갔다가 오고, EBS 강의를 듣고, 아내와 잡담하고, 강아지와 놀고, 원고나 블로그 글 쓰고, 스포츠 중계 보고…. 그때마다 시간은 뭉텅뭉텅 지나가 있다.
그러곤 남는 시간에 하려니 진도가 빠를 리 없다. 결국 야근을 하게 되는데, 일정에 맞춰야 하는 부담감과 피로감 때문에 ‘내가 이걸 왜 한다고 했을까?’하고 후회하면서도 빈 사무실에서 새벽 한두 시까지 불 켜놓고 혼자 야근하던 시절이 떠올라 느낌이 새로웠다.
그 시절에는 화장실에 앉아 있어도 회사는 굴러가고 월급은 나왔다. 그러나 인형의 눈알은 커피를 마시거나 뭘 구상하는 순간에는 저절로 붙지 않았다. 집중해서 움직여야 택시 미터기처럼 실적이 올라가니 힘들어도 참다가 어느 지점에 이르렀을 때 허리를 펴든 눕든 할 수 있었다.
물론 회사에 다닐 때도 다른 일에 한눈팔지 않고 회사 일만 생각해야 돈이 나오고 그걸로 식량을 사서 가족을 지켜냈다. 그것이 바로 ‘생업’의 정의였다. 그때는 벚꽃을 본 게 아니고 일하는 곁눈으로 벚꽃이 지나갔던 것이다.
이 일은 한국형 뉴딜 정책 가운데 디지털 뉴딜사업의 최하단부에 있는 디지털댐 구축작업이다. 민간기업의 인공지능 서비스 개발에서는 데이터를 수집하고 정제하고 가공하는 일이 전체 시간의 80% 이상 차지하기 때문에 댐처럼 데이터를 모아두려는 것이다. 그러니 정확히 말하면 인형 눈알 붙이기가 아니라 물지게를 지고 댐에 물을 채우는 일이다.
비전문적인 대중에게 참여 기회를 주고 수익을 공유하는 ‘크라우드소싱(crowdsourcing)’ 개념도 처음 알게 되었다. 취업 준비생, 경력단절자 등에게 일자리를 주기 위한 목적도 있어 지난해에 3만 명 이상 참여했다고 한다. 직접 해보고 조심스럽게 말하자면, 집에서 할 수 있으니 고학력의 비숙련자가 물리적인 위험을 무릅쓰고 나서는 외부작업보다 나은 것 같았다.
모처럼 기한이 정해진 일에 집중하며 단순한 일상에서 이쪽저쪽으로 시야를 확대한 것 같다. 목덜미 뻐근하고 스트레스받으면서도 재미있고 보람 있던 몇 년 만의 야근이었다. 이 일이 나의 의미 있는 경험에만 그치지 않고 많은 이들에게 힘이 되고, 그 덕분에 우리 인공지능 산업도 추진력을 얻게 되면 좋겠다.