딥시크는 중국의 저장상 항저우에 본사를 둔 인공지능(AI) 전문 스타트업으로 2023년 5월 설립됐다. 딥시크는 지난 12월 대형언어모델(LLM, 텍스트 데이터에 특화된 생성형 AI)인 ‘딥시크 V3’을 발표했고, 이어 1월에는 딥시크 V3를 미세 조정해 추론형 모델(복잡한 문제 해결과 논리적 사고에 특화된 AI)인 ‘딥시크 R1’을 공개했다.
중국의 스타트업이 내놓은 AI가 전세계를 충격에 빠뜨린 이유는 무엇일까. 대형언어모델을 개발하려면 방대한 양의 텍스트 데이터를 처리하고 연산해야 한다. 이러한 연산을 처리하려면 고성능 반도체 칩이 필요하다. 이 때문에 거대 자본을 투입할 수 있는 미국의 빅테크 기업이 시장을 주도해 왔다. 그런데 딥시크는 대형언어모델인 V3를 개발하는데 비교적 저사양 반도체 칩을 사용했다.
미국은 AI 시장경쟁에서 주도권을 잃지 않기 위해 중국에 고성능 반도체 칩 수출을 통제하고 있다. 이에 딥시크가 V3의 모델 훈련에 사용한 반도체 칩은 엔비디아의 GPU인 H800으로, 2022년 8월에 개발돼 상대적으로 구형 제품이다. 엔비디아의 플래그십 GPU로 손꼽히는 H100보다 훨씬 성능이 떨어진다. 이뿐만이 아니다. 딥시크가 V3 훈련에 쓴 비용은 557만6000달러(약 87억원)로 알려졌다. 오픈AI의 챗GPT 개발비용은 1400억원으로 추정되는데 이와 비교하면 20분의 1수준이다. 특히 딥시크의 추론형 모델인 ‘R1’은 오픈AI가 지난해 9월 공개한 ‘o1’과 비슷한 수준을 보여 화제가 됐다. 어떻게 적은 비용으로 이같은 성과를 낼 수 있었을까?
딥시크는 주어진 제약 아래 다양한 방법을 시도했다. 기존 AI와는 달리, 사람이 아닌 AI가 스스로 ‘강화 학습’을 하도록 해서 비용을 줄였다. 강화 학습이란 컴퓨터에 특정 환경을 제공하고, AI가 시행착오를 통해 스스로 배우며 발전하도록 하는 방식을 뜻한다. 강화 학습은 강아지 훈련과 비슷하다. 강아지도 올바른 행동을 하면 간식 등 보상을 주고, 잘못된 행동을 하면 무시하거나 벌을 준다. 이런 시행착오를 거치면 강아지는 어떤 행동을 하면 좋고 나쁜지 습득한다. AI도 좋은 답변은 높은 보상(일종의 평가 점수), 부적절한 답변은 낮은 보상을 받으며 점차 성능이 개선돼 최적의 답변을 찾아낼 수 있다. 보통 대형언어모델(LLM)은 대량의 텍스트 데이터를 학습하는 ‘지도 학습’을 기반으로 만든다. 강화 학습이 텍스트 생성 모델에서 쓰이지 않았던 것은 아니지만, 딥시크는 강화 학습을 주요 방식으로 사용했으므로 기존과는 다소 접근이 달랐던 셈이다.
또한 딥시크는 ‘전문가 혼합(MoE, Mixture of Experts)’ 기법을 활용해 효율을 높이면서도 비용을 낮춘 것으로 알려졌다. 일반적인 AI 모델은 하나의 거대한 신경망이 모든 질문에 답을 하는 방식이다. 반면 MoE는 여러 개의 작은 신경망(전문가)을 따로 두고, 각각의 신경망이 특정한 역할을 수행하도록 하는 방식이다. AI는 질문을 받았을 때 그 질문에 가장 적합한 전문가 몇 개만 골라 활성화한다. 이렇게 하면 불필요한 연산을 줄이고 보다 효율적으로 AI를 운영할 수 있다.
딥시크의 행보가 더욱 매서운 이유는 딥시크가 자사의 AI 모델을 오픈소스로 내놓았다는 것이다. 오픈소스란 전세계 누구나 소스 코드를 자유롭게 수정하고 활용할 수 있도록 일반에 공개한 소프트웨어를 뜻한다. 많은 기업과 개인이 AI 기술을 학술적, 상업적 용도로 손쉽게 활용할 수 있고, 이 과정에서 AI를 더욱 효율적인 모델로 발전시킬 수 있다.
딥시크 AI는 공식 웹사이트(https://www.deepseek.com) 또는 애플 앱스토어 또는 구글 플레이에서 ‘DeepSeek’ 앱을 내려받아 사용할 수 있다. 챗GPT와 같이 질문을 입력하면 답변을 받아볼 수 있다. 화면 하단에 있는 ‘딥씽크(R1)’ 버튼을 누르면 R1 모드가 활성화돼 질문에 관한 답변을 추론하는 과정을 보여주며, 체계적이고 밀도 있는 답변을 얻을 수 있다.
다만 종종 질문을 했는데 ‘The Server is busy. Please try again later.’라고 답할 수도 있다. 현재 사용자가 많아 서버가 포화됐거나 질문을 많이 했을 경우 이같은 답변이 나올 수 있다. 이럴 때는 잠시 후 질문하면 다시 답변을 받을 수 있다. 다만 중국과 관련해 민감한 질문을 했을 경우에도 이같은 방식으로 회피한다. 실제로 ‘중국에서는 왜 인스타그램을 사용할 수 없어?’, ‘동북공정에 대해 알려줘’와 같은 질문에 딥시크는 답변을 내놓지 않았다.
딥시크의 문제점은 또 있다. 다른 AI 서비스 대비 사용자의 개인정보를 광범위하게 수집하고, 수집한 정보를 중국 서버에 보관한다고 약관에 명시해 보안 우려를 낳고 있다. 이에 호주, 이탈리아, 대만은 딥시크 사용을 금지했으며 다른 나라도 딥시크에 대한 규제를 검토하고 있다. 우리나라도 내부 보안이 중요한 외교·통상 분야 정부 부처, 일부 공기업, 금융사가 딥시크의 업무 목적 사용을 금지하는 조치를 내렸다. 한편, 오픈AI는 딥시크가 챗GPT에서 대량의 데이터를 추출, 무단으로 도용해 AI를 개발했다는 의혹을 제기하며 조사에 착수한 상황이다. 중기이코노미 안수영 기자
<저작권자 ⓒ 중기이코노미. 무단전재 및 재배포 금지>