평소 인터뷰가 잡힌 날에는 손톱이 길지 않은지 먼저 확인을 한다. 쉴 새 없이 키보드를 두드려야 하는데, 오타가 생길 확률을 최소화하기 위해서다. 이런 노력에도 정신없이 옮겨 적은 문서에는 가끔 알아보기 힘든 단어나 외국어가 섞여 들어가곤 한다.
지난 15일 네이버 인공지능(AI) 음성기록 서비스 '클로바노트'를 다운로드해 일주일간 사용해봤다. 사람을 완벽히 대체할 수 없을 것이라는 의심도 잠시, 지금까지의 고생이 원망스러울 정도로 기대 이상의 성능을 자랑했다.
클로바노트는 딥러닝 기술을 활용해 음성을 문자로 변환(STT)하는 서비스다. 현재 무료로 이용할 수 있으며, 녹음 파일 업로드는 한 번에 최대 3시간(180분), 한 달에 최대 600분까지 가능하다. 앱으로 한 녹음은 무제한으로 바꿀 수 있다.
올해 8월부터 한국어 외 영어와 일본어 등 다국어 인식도 지원하고 있다. 수업 내용 기록과 회의록 작성 등에 쓰이며 작년 11월 서비스 출시 후 1년 만에 100만 가입자를 돌파했다.
최근까지 사용해본 결과, 기사 작성을 위해 통화한 내용을 옮길 때 활용도가 높았다.
사용법은 간단하다. 앱을 실행하면 첫 화면에 지금까지 변환한 파일 목록이 뜬다. 하단 중앙의 '+' 버튼을 누르면 '음성 녹음' '파일 업로드' 중 하나를 선택할 수 있다. 여기서 파일 업로드 메뉴에 진입해 '통화 음성' '일반 음성' 중 하나를 고르면 된다.
10분 길이의 통화 음성을 업로드·변환하는 데 걸리는 시간은 1분도 채 되지 않았다. '참석자1' '참석자2'처럼 목소리를 구별해 메신저를 사용한 것처럼 대화 내용을 정렬한다.
특정 대화를 누르면 해당 음성이 나오는 구간으로 이동해 다시 한번 들어볼 수 있다. 북마크를 남겨 나중에 쉽게 조회할 수 있다.
변환이 잘못됐거나 추가 내용을 입력하기 위해 각 대화를 직접 수정할 수 있는데, AI가 변환한 내용에서 오타는 거의 찾아볼 수 없었다.
오류가 아예 없는 것은 아니지만, 눈에 띄는 정도는 아니다. 한 참석자가 오래 이야기를 이어가는 도중에 다른 참석자가 '그렇죠' '맞습니다' 등 추임새를 넣으면 걸러내지 못한다. 낮은 음성으로 '음'과 같은 표현을 하면 '고마워요'라고 잘못 변환하기도 했다.
앱 메인화면의 프로필 버튼을 누르면 간단한 자기소개와 잔여 사용 시간 등을 볼 수 있다. 베타 서비스 중 녹음은 무제한 변환할 수 있지만, 사용 시간을 모두 소진하면 파일 업로드는 제한된다.
배경 소음이 적고 3명 이하의 대화에서 더욱 정확하게 기록할 수 있다는 게 네이버의 설명이다. 향후에는 코멘트 작성·업무 관리·공동 편집·그룹 관리 등 다양한 편집 기능을 추가할 계획이다.
정길준 기자 jeong.kiljhun@joongang.co.kr