KT가 글로벌 빅테크에 맞서 자체 개발한 모델로 생성형 인공지능(AI) 시장에 출사표를 던졌다. 인프라 경쟁력을 앞세워 일찍이 수요가 감지된 B2B(기업 간 거래) 영역을 시장으로 소비자 친화 서비스를 잇달아 선보일 방침이다.
KT는 31일 서울 서초구 KT 연구개발센터에서 초거대 AI '믿음'을 공개했다. 경량 모델부터 초대형 모델까지 4종을 기업들이 맞춤형으로 사용할 수 있도록 설계했다.
KT는 초거대 AI를 경험하고 싶지만 방법을 모르는 기업들을 위해 믿음의 파운데이션 모델을 개방한다.
파운데이션 모델은 방대한 데이터셋으로 학습한 초거대 AI 핵심 기반 모델을 뜻한다. 오픈AI의 자연어 처리 모델 GPT가 대표적이다.
최준기 KT AI·빅데이터 사업본부장은 "지금 챗GPT를 쓸 수는 있지만 누구나 파인튜닝(미세조정)을 해보기는 어려운 상황"이라며 "한국어 성능에서도 부족한 부분이 있는 만큼 모델을 개방해 함께 크겠다는 의지"라고 했다.
이처럼 기업 고객들의 갈증을 해결하기 위해 KT는 국내 최초로 조 단위 데이터의 사전 학습을 완료한 자체 파운데이션 모델 믿음을 외부에 풀었다.
이를 바탕으로 LLM(거대언어모델)의 B2B 사업화를 가속하고, 궁극적으로 기업들이 원하는 AI 사업 모델과 응용 서비스의 확산을 이끌어낸다는 계획이다.
기존 대비 약 27%에 가까운 GPU(그래픽처리장치) 학습 비용 절감이 가능한 KT클라우드의 HAC(하이퍼스케일 AI 컴퓨팅) 서비스, 추론 비용을 기존 대비 50% 절감한 리벨리온의 NPU(신경망처리장치) 인프라 등을 통합 패키지로 제공할 예정이다.
KT 믿음은 강력한 신뢰 패키지가 차별화 무기다.
생성형 AI의 문제점인 'AI의 환각 답변'(할루시네이션)을 해결하기 위해 검색과 추론, 답변 모든 단계에서 신뢰성을 높이는 세 가지 기술을 적용했다.
'다큐먼트 AI'는 도식화된 복잡한 문서도 모델이 정확히 이해할 수 있도록 변환한다. '서치 AI'는 목표 도메인과 문서에 최적화한 최신 정보를 찾아낸다. '팩트가드 AI'는 원문에 근거한 응답만 생성하도록 강화 학습을 도입했다.
해당 기술로 할루시네이션 현상을 일반 생성형 AI 서비스 대비 최대 70% 가까이 줄일 수 있다고 회사는 설명했다.
배순민 KT AI2XL 연구소장은 "어떤 데이터에 문제가 있는지 확인하는 인력이 여럿 있다. 편향성 이슈와 관련해 개인차가 많다는 생각을 했다"며 "특히 대화에 있어서는 사회적으로 용납이 가능한 AI를 만들기 위해 노력하고 있다"고 말했다.
믿음 4종 모델 중 외부에 완전히 개방하는 70억 파라미터 규모의 경량 모델은 한국어 LLM 평가 리더보드인 '오픈 Ko LLM'에서 최상위를 기록하기도 했다.
블룸버그 인텔리전스의 보고서에 따르면 생성형 AI 시장은 2032년 약 1조3000억 달러(약 1750조원) 규모로 성장할 전망이다.
KT는 이번 믿음 출시를 계기로 기업 전용 LLM 사업화와 새로운 AI 혁신 사업 발굴 등 B2B 시장에 우선 집중한다.
수익화 예상 시점을 묻자 최준기 본부장은 "좁게만 봐도 우리나라에서 3년 뒤에는 3000억원 이상의 시장이 열릴 것으로 보고 있다"며 "희망컨데 BEP(손익분기점)는 빨리 달성하는 게 좋겠지만 불가능하다는 생각은 안 하고 있다"고 말했다.
또 B2C(기업-소비자 거래) 서비스 출시 계획과 관련해 "유무선 통신과 IPTV 등 많은 가능성을 가지고 있고 몇 가지 아이템을 준비하고 있어 때가 되면 소개하겠다"고 했다.