
▷엔비디아와의 비교 담론이 문제라는 얘기인가.
“AI의 훈련, 추론을 막론하고 엔비디아 칩의 성능은 압도적이다. 우리는 저 넓은 영역 중에서도 추론, 추론 시장 안에서도 특정 세그먼트(분야)를 겨냥하고 있을 뿐이다. 우리의 목표는 ‘NPU(신경망처리장치) 진영’에서 1위를 하는 것이다. 구글 TPU의 80% 정도 따라잡으려고 시도하고 있다.”
▷‘엔비디아 대항마’라는 말이 흔히 쓰이는데.
“특정 벤치마크에서 국내 칩이 엔비디아를 앞설 수는 있다. 벤치마크를 유리하게 잡으면 100배 좋은 성능도 나온다. 하지만 100가지가 넘는 엄청난 종류의 벤치마크 중에서 겨우 두세 개 앞서는 것으로, 그것도 실전에 당장 적용할 수 없는 모델로 테스트하고 ‘엔비디아 칩보다 좋다’고 하는 건 거짓말이다.”
▷리벨리온의 ‘특정 세그먼트’는 무엇인가.
“멀티모달을 타깃으로 하고 있다. 언어뿐만 아니라 소리, 그림, 영상 등도 이해할 수 있는 AI 모델이다. AI가 동영상을 이해할 수 있는 시대가 오면 리벨리온 칩이 더 빛날 수 있다는 자신감이 있다.”
▷무엇을 목표로 삼고 있는가.
“고객사 총소유비용(TCO)을 3분의 1로 줄이는 것이다. TCO는 두 가지 측면으로 나뉜다. 설비투자(CAPEX)와 운영비(OPEX)다. 엔비디아의 칩은 비싸고, 전력 소모가 크다. 우리는 ‘특정 세그먼트’에서 엔비디아 H200의 3분의 1 가격으로 3분의 1의 전력을 소요하는 칩을 만드는 것을 목표로 삼고 있다.”
▷실현 가능한 목표인가.
“당장 할 수 있다는 것은 아니다. 하지만 대량 양산 체제가 된다면 해볼 만한 타깃 수치다. 지금은 소프트웨어 고도화 등 여러 가지 면에서 엔비디아를 쫓아가는 입장이다. 엔비디아와의 격차를 인정하는 것이 모든 것의 출발점이다.”
▷최근 리벨 쿼드를 출시했는데.
“AI 연산기 4개를 한 개 기판 위에 결합한 칩렛 형태고, 5세대 HBM(HBM3E) 4개를 장착한 점에서 ‘빅칩(big chip)’이다. 칩 스펙 자체는 엔비디아 A100을 넘어 H200과 거의 동일하다. 삼성 엑시노스 AP 8~9개 이상의 칩을 하나로 합친 성능이기도 하다.”
▷칩당 전력은 어느 정도인가.
“현재 600~1000W 정도인데 이걸 하드웨어·소프트웨어 최적화를 통해 500~600W 수준으로 밀어 넣는 작업을 하고 있다. 엔비디아 제품은 칩당 1000W를 훌쩍 넘는다. 아직 고객사가 원하는 수준을 맞춘 것은 아니지만 일단 예선은 통과했다. 최적화 작업은 최소 1년씩 걸린다.”
▷소프트웨어 경쟁력에 대한 의문이 있다.
“엔비디아 소프트웨어가 얼마나 훌륭한지 말하는 건 입이 아플 정도다. 포인트는 이들을 어떻게 따라잡을지를 구상하는 것이다. 소프트웨어의 핵심은 컴파일러다. 컴파일러는 앞단(프런트엔드)과 뒷단(백엔드)으로 나뉜다. 우리는 그중에서 프런트엔드 쪽의 변화를 유심히 보고 있다.”
▷엔비디아 쿠다(CUDA)를 넘을 방법이 있는가.
“지금 AI업계에선 제2의 리눅스 모먼트라고 할 만큼 거대한 판도 변화가 느껴진다. AI 빅테크가 ‘탈엔비디아’를 하려면 쿠다(CUDA) 같은 소프트웨어를 걷어내야 한다는 문제가 있는데, 이걸 오픈소스로 해결하려고 하고 있다.”
▷서버 단위에서 칩 경쟁력을 평가해야 한다는 얘기가 나온다.
“요즘 데이터센터는 ‘AI 토큰 생성기’ 역할을 한다. 궁극적으로는 데이터센터의 모든 랙이 얼마나 많은 토큰을 뱉어낼 수 있는지만을 봐야 한다는 것이다. 우리도 이것을 고민하고 있다. 랙 스케일 역시 엔비디아를 쫓아가야 하는 입장이 맞다.”
▷어떻게 돌파해야 하는가.
“서버와 서버, 랙과 랙 간 통신은 마벨과 브로드컴이 잘한다. 지금은 엔비디아와 마벨·브로드컴 진영이 대결하는 국면이다. 이런 상황에서 우리가 단독으로 잘할 수는 없다. 그래서 마벨과 협업한다. 제일 중요한 랙의 스위치 칩뿐만 아니라 랙 단위의 중앙처리장치(CPU)까지 공동으로 개발하고 있다.”
▷리벨 쿼드의 고객사가 있는가.
“미국 빅테크에 시제품을 공급한 상태다. 그들이 우리에게 테스트 조건을 전달했고 자체 실험을 했다. 405B 모델을 8장의 카드로 나눠 연산할 때 실제 전력 기반으로 H200보다 약 2.3배 뛰어난 전성비를 보였다는 테스트 결과를 만들어냈다. 현재 가장 범용으로 쓰이는 칩과 동등한 스펙에서 비교된 건 아니지만 ‘대체할 수 있다’는 잠재력을 보여줬다.”
강해령 기자 hr.kang@hankyung.com