카카오, 차세대 언어모델 '카나나-2' 4종 오픈소스 공개, 실용성·효율 잡았다
본문

© KAKAO
카카오(대표 정신아)가 자체 개발한 차세대 인공지능(AI) 언어모델 '카나나-2(Kanana-2)'를 대거 공개하며 AI 기술 생태계 확장에 나섰다.
카카오는 20일, 지난달 허깅페이스를 통해 처음 선보인 '카나나-2'의 성능을 대폭 업데이트한 모델 4종을 추가로 오픈소스로 공개했다고 밝혔다. 이번에 공개된 모델들은 '에이전틱(Agentic) AI' 구현에 최적화된 고성능·고효율 기술력이 집약된 것이 특징이다.
비싼 GPU 없어도 OK, MoE 기술로 효율 극대화
'카나나-2'의 핵심 경쟁력은 효율성이다. 카카오는 '전문가 혼합(MoE, Mixture of Experts)' 아키텍처를 적용해 모델의 파라미터(매개변수)는 320억 개(32B)에 달하지만, 실제 추론 시에는 상황에 맞는 30억 개(3B)의 파라미터만 활성화되도록 설계했다.
이를 통해 연산 효율을 획기적으로 높여, 최신 초고가 인프라가 아닌 엔비디아 A100 수준의 범용 GPU에서도 원활하게 구동할 수 있다. 이는 중소기업이나 학계 연구자들도 큰 비용 부담 없이 고성능 AI를 활용할 수 있는 길을 열어준 것으로 평가된다.
또한, 사전 학습과 사후 학습 사이에 '미드 트레이닝(Mid-training)' 단계를 신설하고, 새로운 정보를 배울 때 기존 지식을 잊는 현상을 방지하는 '리플레이(Replay)' 기법을 도입해 한국어 구사 능력과 일반 상식 능력을 동시에 강화했다.
AI가 스스로 도구 쓴다, 에이전트 능력 강화
이번 모델은 단순 대화를 넘어 실질적인 업무 수행이 가능한 '에이전트 AI' 기능이 대폭 강화됐다. 카카오는 고품질의 '도구 호출(Tool Calling)' 데이터를 집중 학습시켜, 복잡한 사용자의 지시를 정확히 이해하고 적절한 도구를 스스로 선택해 실행하는 능력을 높였다.
실제 성능 평가에서도 동급 경쟁 모델인 'Qwen-30B' 대비 ▲지시 이행 정확도 ▲멀티턴 도구 호출 성능 ▲한국어 능력 등에서 압도적인 우위를 기록했다.
공개된 모델은 ▲기본(Base) 모델 ▲지시 이행(Instruct) 모델 ▲추론 특화(Thinking) 모델 ▲미드 트레이닝(Mid-training) 모델 등 총 4종이다.
글로벌 최상위 성능 목표, 초대형 모델도 준비 중
카카오는 현재 MoE 구조를 기반으로 한 수천억 파라미터 규모의 초대형 모델 'Kanana-2-155b-a17b'도 개발 중이다. 이 모델은 중국 지푸 AI(Zhipu AI)의 모델 대비 40% 수준의 데이터만으로도 대등한 성능을 보이는 등 높은 학습 효율을 입증하고 있다.
김병학 카카오 카나나 성과리더는 "새로워진 카나나-2는 고가의 인프라 없이도 실용적인 에이전트 AI를 구현할 수 있도록 치열하게 고민한 결과"라며 "보편적인 환경에서도 고효율을 내는 모델을 오픈소스로 공개해 국내 AI 생태계 발전에 기여하겠다"고 밝혔다.
- 이전글 수조 달러가 움직인다… 젠슨 황이 말한 AI 진짜 본질 26.01.27
- 다음글 OpenAI, 챗GPT에 광고 띄운다. '무료 AI 접근성 확대 위한 결단' 26.01.19
등록된 댓글이 없습니다.
