(사진=NC AI)
NC AI는 온디바이스 환경에서 구동 가능한 초경량 멀티모달 AI 모델 'VARCO VISION 2.0 1.7B'(바르코 비전 2.0)를 공개했다고 30일 밝혔다.
해당 모델은 1.7B(17억) 파라미터의 작은 크기에도 불구하고 기존 경량 모델들을 뛰어넘는 수준의 성능을 지켰다. 개인 디바이스에서도 고성능 멀티모달 AI를 활용할 수 있는 길을 열었다는 게 NC AI 측의 설명이다.
'바르코 비전 2.0'은 이미지와 텍스트를 함께 이해해 질문에 답할 수 있는 차세대 인공지능 모델로, 여러 장의 이미지를 동시에 분석할 수 있어 복잡한 문서나 표, 차트도 효과적으로 처리할 수 있는 비전언어모델(VLM)이다.
이번 모델은 텍스트 처리, 한국어 성능에서 글로벌 톱 오픈소스 멀티모달 모델인 InternVL3 2B, Ovis2 2B 등을 압도하며 동급 최고 모델임을 입증했다.
특히 영문 텍스트 처리 MT-Bench와 한국어 K-SEED, K-LLaVABench는 물론 광학문자 판독 CORD, ICDAR 등 다양한 벤치마크에서 글로벌 모델들의 성능을 넘겼다. LLM은 물론 멀티모달 구축의 기술력도 요구되는 독자AI 프로젝트를 진행 중인 국내 AI 생태계에서 의미 있는 성과라는 평가다.
여러 주요 벤치마크에서도 2배 가까이 더 큰 규모의 국내 모델들과 어깨를 나란히하는 성능을 기록했다. 대학 수준의 지식을 검증하는 MMMU 벤치마크와 과학 차트 이미지 해석 능력을 평가하는 AI2D 벤치마크에서는 카카오의 카나나 3B, 네이버의 하이퍼클로바 3B 등 3B급 멀티모달 모델들과 동등하거나 뛰어난 성능을 보였다.
또 시각적 맥락에서의 수학적 추론 능력을 평가하는 MathVista 벤치마크와 멀티모달 AI의 종합적인 시각언어 기능을 평가하는 MM-Vet에서도 윗 체급의 모델들 사이에서 2위를 기록했다. 모델의 크기가 성능을 결정하는 절대적 요소가 아니라는 것을 증명했다는 게 회사의 설명이다.
이번 경량 모델은 스마트폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 최적화됐다. 이는 기존 멀티모달 AI가 대부분 클라우드 환경에서만 활용 가능했던 한계를 넘어, 개인 디바이스에서도 고성능 멀티모달 AI를 직접 활용할 수 있게 됐다.
온디바이스 AI의 장점은 개인정보 보호와 실시간 처리 능력에 있다. 사용자의 데이터가 외부 서버로 전송되지 않아 프라이버시가 보호되며, 네트워크 연결 없이도 즉시 AI 기능을 사용할 수 있다.
NC AI는 이번 모델을 오픈소스로 공개한다. 앞서 국내 AI 생태계 발전과 연구 활성화에 기여하기 위해 바르코 비전 2.0 모든 모델을 연구용 오픈소스로 공개한다고 밝힌 데 이어, 앞으로도 개발하는 모델을 오픈소스로 공개할 계획이다.
이연수 NC AI 대표는 "NC AI가 보여준 경량 고성능 모델 개발 능력을 통해 다양한 국내 산업군의 경쟁력을 높일 것"이라며 "'바르코 비전 2.0 1.7B'는 AI 기술의 자립과 민주화를 위한 중요한 이정표로, 앞으로도 더 많은 사람들이 쉽게 접근할 수 있는 고성능 AI 모델 개발에 최선을 다하겠다"고 말했다.
한편, NC AI는 현재 정부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'에 도전하고 있다. 이번 멀티모달 모델 개발 역량과 함께 패션, 게임, 미디어 등 다양한 산업군에서의 버티컬 AI 서비스 운영 경험을 바탕으로 전 국민의 AI 접근성을 높이고 국가 AI 경쟁력 강화에 기여한다는 계획이다.