딥시크 V3의 매개변수 규모는 역대 오픈 소스 모델 중 가장 크다. 메타 ‘라마 3.1’의 1.5배 이상이다. 딥시크에서도 글쓰기, 컴퓨터 프로그램 개발(코딩), 번역 등 문자 기반의 다양한 작업이 가능하다.
이 AI의 성능은 글로벌 최고 수준이다. 딥시크가 공개한 자료에 따르면 V3는 코딩 벤치마크(성능 평가)에서 오픈AI의 ‘GPT-4o’, 메타의 ‘라마-3.1’ ‘클로드-3.5 소넷’ 등을 넘어섰다. 수학에선 성능 차이가 더 컸다. 미국 고등학교 수학 경시대회 문제로 평가하는 ‘MATH 500’ 기준으로 딥시크 V3는 90.2점을 기록했다. 나머지는 모두 70점대에 그쳤다.
딥시크가 A100, H100 등 엔비디아의 최신 최고 사양 반도체를 활용하지 않았다는 점도 눈여겨볼 만하다. 미국 정부는 중국이 고성능 반도체를 확보해 군사 무기와 첨단 기술을 개발하는 것을 막기 위해 2022년 10월부터 A100과 H100의 중국 수출을 금지했다. 딥시크가 확보한 H800은 엔비디아가 기존 H100을 중국 수출용으로 변형한 저사양 모델이다. 미국 정부는 2023년 10월 H800의 수출도 금지했지만 중국이 상당량의 물량을 확보한 뒤였다.
중국 AI 저력의 바탕은 인적 인프라다. 한국과학기술기획평가원에 따르면 중국의 AI 연구자 규모는 2022년 기준으로 41만 명이 넘는다. 2위 인도(19만5000명)와 3위 미국(12만 명)을 합친 것보다 많다. AI 논문 발행은 같은 기간 22만 건으로 미국의 세 배 수준이다.
딥시크의 개발자 역량도 뛰어난 것으로 알려졌다. LLM 개발팀을 이끄는 유우는 마이크로소프트(MS) 선임연구원 출신이다. 딥시크 V3를 개발하고 최근 샤오미로 이직한 뤄푸리는 중국에선 ‘1995년생 천재 AI 소녀’로 불린다. 2019년 글로벌 AI 학회인 전산언어학학회(ACL)에 제1 저자 2편을 포함해 총 8편의 논문을 공개해 화제가 됐다.
김주완 기자 kjwan@hankyung.com