KT는 한국적 AI의 핵심 자산인 고품질 데이터를 확보하기 위해 기업과 공공, 학계가 모인 'K 데이터 얼라이언스'를 출범했다고 16일 밝혔다.
KT를 비롯해 고려대학교 민족문화연구원, 두산디지털이노베이션, 아이스크림에듀, 중앙일보, 한국교육방송공사(EBS), 한글학회가 참여했다.
주관사인 KT는 16일 서울 송파구 소피텔 앰배서더 서울에서 열린 협약식에서 한국적 AI 철학을 구현하기 위해 한국어 고유 표현과 사회·문화적 맥락, 사용자의 다양한 목적을 반영할 수 있는 고품질 데이터의 중요성을 강조했다.
앞으로 각 기관들은 한국적 AI를 위한 데이터 구축, 한국적 AI 관련 도메인 선도 사례 창출, 한국적 AI 관련 활동·성과에 대한 홍보 및 대외 확산, 한국적 AI 데이터에 기반한 인문·사회 분야 연구에 힘을 모은다.
KT는 각 기관이 보유한 콘텐츠들을 선별해 고품질 데이터로 가공하고, AI가 학습할 수 있는 형태로 구조화해 독자 개발 모델인 '믿:음 2.0', 마이크로소프트 협력 기반 GPT 모델, 오픈소스 모델 등의 한국적 AI 모델과 서비스로 연결할 방침이다.
특히 EBS의 검증된 학습·교양 콘텐츠, 질문과 답변 형태로 구조화된 피드백 기반 학습 데이터는 AI 모델의 핵심 기능인 추론 능력을 향상시킬 수 있는 최적의 자원이라고 설명했다. 한국어 사용자 특유의 질문 방식과 문맥을 이해하는 데 있어 높은 가치를 지녔다.
오승필 KT 기술혁신부문 부사장은 "K 데이터 얼라이언스가 한국적 AI의 지속적인 고도화와 실용화에 있어 핵심 동력이 될 수 있도록 힘을 모아 협력해 나갈 것"이라고 말했다.